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AF 提 要 


本 书 讲述 了 Linux 系 统 及 其 他 UNIX 风 格 的 操作 系统 上 的 程序 开 
发 ， 主 要 内 容 包 括 标准 Linux C 语 言 贸 数 库 和 由 不 同 的 Linux 或 UNIX 标 
准 指 定 的 各 种 工具 的 使 用 方法 ， 大 多 数 标准 Linux 开 发 工具 的 使 用 方 
法 ， 通 过 DBM 和 MySQL 数 据 库 系统 存储 Linux 中 的 数据 ， 为 X 视 窗 系 
统 建立 图 形 化 用 户 界面 等 。 本 书 通过 先 介绍 程序 设计 理论 ， 再 以 适当 
HJ EIL T URS M BAERE R BA ERIT, 帮助 读者 迅速 掌握 相关 的 知 
VA? 

本 书 适合 Linux 的 初学 者 及 希望 利用 Linux 进 行 开发 的 程序 人 员 阅 
读 ， 也 适合 作为 高 等 院 校 计算 机 相关 专业 师 生 的 参考 教材 。 
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所 有 的 计算 机 程序 员 都 会 随手 记 下 大 量 笔记 ， 其 中 的 代码 示例 往 
往来 自前 人 对 使 用 手册 的 深入 钻研 ， 或 者 来 自 Usenet 新 闻 组 ， 来 自 后 
者 的 代码 有 时 连 最 育 目 的 探索 者 也 不 敢 照 搬 照抄 (当然 也 有 男 一 种 观 
点 认为 ， 他 们 都 可 以 目 由 地 访问 Usenet 新 闻 组 ， 并 且 从 来 没有 停止 过 
对 其 中 代码 的 使 用 ) ， 但 采用 这 种 风格 的 图 书 可 以 说 少 之 又 少 ， 这 不 
能 不 说 是 一 件 很 奇怪 的 事情 。 在 因特网 中 ， 存 在 着 大 量 针 对 程序 设计 
和 系统 管理 特定 领域 的 、 短 小 精 悍 而 又 切中 问题 关键 的 文档 。Linux 文 
档 项 目 发 表 了 一 系列 的 文档 ， 内 容 涵 盖 了 Linux 的 各 个 方面 ， 从 在 同一 
台 机 老 上 同时 安装 Linuxz 和 Windows 到 将 你 的 咖啡 机 连接 到 Linux 系 
统 。 你 可 以 通过 网 址 http:Wwww.ttdp.org 来 查看 Linux 文 档 项 目 。 

从 男 一 方面 来 看 ， 现 在 的 图 书市 场 充 不 着 大 量 这 样 的 图 书 ， 它 们 
要 么 是 大 部 头 的 巨著 ， 内 容 详尽 而 全 面 ， 使 得 你 没有 时 间 把 它们 读 
完 ; 要 么 就 是 完全 面 同 初 学 者 的 入 门 图 书 ， 你 购买 它们 只 是 为 了 送 给 
朋友 ( 开 个 玩笑 而 已 。 只 有 很 少 的 书籍 尝试 着 对 大 量 实际 应 用 领域 
的 基本 概念 和 做 法 进行 介绍 。 本 书 束 是 其 中 之 一 ， 它 是 对 程序 员 笔 记 
的 摘要 ， 经 过 破译 (要 认 清 程序 员 的 笔迹 可 并 非 易 事 ) 和 编辑 ， 并 将 
它们 有 机 地 组 织 起 来 。 

本 书 这 一 版 经 过 了 审阅 和 更 新 ， 反 映 了 目前 Linux 开 发 的 现状 。 


Alan Cox 
Linux 内 核 维护 者 
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欢迎 阅读 本 书 第 4 版 ， 这 是 一 本 针对 在 Linux 系 统 和 其 他 UNIX 风 格 
的 操作 系统 上 进行 程序 开发 的 易于 使 用 的 指南 性 读物 。 

在 本 书 中 ， 我 们 的 目标 是 介绍 对 于 Linux 程 序 员 来 说 非常 重要 的 主 
题 ， 这 些 主题 的 涵盖 面 非 常 广泛 。 书 名 中 的 “beginning” 更 多 的 是 指 书 
中 的 内 容 而 不 是 读者 的 技能 。 我 们 对 本 书 的 内 容 组 织 进行 了 精心 的 安 
排 ， 以 帮助 读者 更 多 地 了 解 Linux 所 提供 的 功能 ， 而 不 管 读 者 现 有 的 经 
验 有 多 少 。Linux 程 序 设计 是 一 个 很 大 的 领域 ， 我 们 的 目标 是 对 广泛 领 
从 而 让 读者 在 每 个 主题 上 都 具备 足够 的 
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读者 对 象 


如 果 你 是 一 位 程序 员 ， 和 希望 利用 Linux (或 UNIX) 提供 给 软件 开 
发 者 的 工具 来 加 快 程序 开发 的 进度 ， 尺 量 减少 编程 时 间 并 让 你 的 程序 
充分 利用 Linux 系 统 所 提供 的 功能 ， 那 么 本 书 将 非常 适合 你 。 书 中 明确 
清晰 的 解释 和 分 步 又 的 实验 ， 将 帮助 你 迅速 提高 编程 能 力 和 掌握 所 有 
的 关键 技术 。 

我 们 假设 读者 具备 一 些 C 或 C++ 语言 的 编程 经 验 ， 这 些 经 验 可 能 
目 Windows 系 统 或 其 他 一 些 操作 系统 。 但 我 们 会 尽量 保持 书 中 示例 程 
序 的 人 简单， 即便 你 不 是 一 个 C 语 言 编 程 专家 ， 也 可 以 轻松 地 阅读 本 
书 。 如 采 存 在 需要 直接 比较 Linux 程 序 设计 和 C/C++ 程序 设计 的 情况 ， 
我 们 都 会 在 书 中 指出 。 


如 果 你 刚 开 始 学 习 Linux， 请 注意 ， 这 不 是 一 本 介绍 Linux 安 
装 和 配置 的 图 书 。 如 果 你 想 多 学 习 一 些 Linux 系 统管 理 方面 的 知 
识 ， 请 阅读 其 他 的 参考 书籍 ， 如 Christopher Negus 的 Linux Bible 
2007 Edition Wiley, ISBN 978-0470082799) 9 


本 书 的 目标 是 作为 一 本 教程 ， 问 读者 介绍 大 多 数 Linux 系 统 上 都 有 
的 各 种 工具 和 函数 / 范 数 库 集 ， 同 时 本 书 也 可 以 作为 一 本 方便 使 用 的 参 
著 手 册 。 本 书 的 特点 古人 简单 易 懂 、 内 容 广 泛 、 示 例 丰 证 。 


主要 内 容 


本 书 希 户 让 你 达到 以 下 几 个 学 习 目 标 。 

O 掌握 标准 Linuix C 语 言 琅 数 库 和 由 各 种 Linux 或 UNIX 标 准 指 定 

的 其 他 工具 的 使 用 方法 。 

O 掌握 如 何 使 用 大 多 数 标 准 Linux 开 发 工具 。 

口 “ 学 会 通过 DBM 和 MySQL 数 据 库 系统 存储 Linux 中 的 数据 。 

O 理解 如 何 为 X 视 窗 系统 建立 图 形 用 户 界 面 。 我 们 将 同时 使 用 

GTK ” (GNOME 环境 的 基础 ) 和 Qt (KDE 环 境 的 基础 ) 函数 库 。 

口 拥有 开发 自己 的 实际 应 用 程序 的 信心 和 能 力 。 

在 讨论 这 些 主题 时 ， 我 们 首先 介绍 编程 理论 ， 然 后 通过 适当 的 例 
子 和 清晰 的 解释 来 前 明 它 。 通 过 这 种 方式 ， 你 可 以 在 第 一 远 的 学 习 中 
就 能 够 迅速 掌握 相关 知识 。 如 有 必要 ， 你 还 可 以 回顾 这 些 内 容 以 重 温 
所 有 的 基本 要 素 。 

书 中 小 示例 程序 主要 是 为 了 演示 一 组 函数 的 用 法 或 某 些 新 概念 的 
实际 使 用 情况 。 吐 罕 全 书 有 一 个 大 型 的 示例 项 目 : 一 个 简单 的 用 于 记 
条 首 乐 CD 详细 资料 的 数据 麻 应 用 程序 。 随 着 知识 面 的 扩展 ， 你 可 以 按 
照 目 己 的 意愿 开发 、 重 新 实现 和 扩展 这 个 项 目 。 虽 然 如 此 ， 这 个 CD 应 
用 程序 对 本 书 的 任何 一 草 来 说 都 不 是 必需 的 ， 所 以 只 要 你 愿意 也 可 以 
忽略 它 ， 但 我 们 认为 它 对 书 中 讨论 的 技术 提供 了 一 些 有 用 的 和 深入 的 
示范 ， 并 且 它 还 有 助 于 讲解 每 个 高 级 主题 。 我 们 对 这 个 应 用 程序 的 第 
一 次 讨论 出 现在 本 书 第 2 章 的 结尾 处 ， 它 显示 了 一 个 非常 大 的 shell 脚 本 
是 如 何 组 织 的 ，shel 如 何 处 理 用 户 输入、 如 何 构造 菜单 以 及 如 何 存储 
和 检索 数据 o 

在 简要 介绍 完 编 译 程 序 、 链 接 函 数 库 和 访问 在 线 手 册 的 基本 概念 
后 ， 将 全 面 介 绍 shell 编 程 。 然 后 你 将 投入 到 C 语 言 程序 设计 中 ， 我 们 
在 这 里 讨论 的 内 容 包 括 文件 操作 、 从 Linux 环 境 中 获取 信息 、 处 理 终端 
的 输入 输出 和 curses 范 数 库 ( 它 使 得 交互 式 的 输入 和 输出 更 易于 管 
FH) 。 最 后 你 将 用 C 语 言 重 新 实现 CD 应 用 程序 。 应 用 程序 的 设计 方法 
Baer {EBT ATR ES PR FS curses ERE $e B $k FREY PAR 


接 下 来 我 们 讨论 数据 管理 。 为 了 学 习 dbm 数 据 库 画 数 座 的 使 用 方 
法 ， 我 们 将 再 次 重新 实现 这 个 应 用 程序 ， 但 这 次 实现 所 采用 的 设计 方 


法 将 贯穿 本 书后 续 的 一 些 章 节 。 在 其 后 的 一 章 中 ， 我 们 将 介绍 数据 是 
如 何 使 用 MySQL 存 储 在 一 个 关系 数据 库 中 的 ， 并 且 我 们 还 将 在 该 章 的 
稍 后 部 分 重新 使 用 这 种 数据 存储 技术 ， 以 便 读 者 了 解 两 种 技术 的 区 
别 。 随 着 这 些 应 用 程序 的 规模 越 来 越 大 ， 我 们 接 下 来 需要 介绍 调试 、 
源 代码 控制 、 软 件 发 行 和 makefile 文 件 等 具体 内 容 。 

接 下 来 ， 你 将 看 到 不 同 的 Linux 进 程 是 如 何 使 用 各 种 技术 进行 通信 
的 ， 以 及 Linux 程 序 是 如 何 使 用 套 接 字 来 文 持 不 同 机 器 之 间 的 TCP/P 网 
络 通信 的 ， 包 括 与 使 用 不 同 处 理 器 架构 的 机 器 之 间 通 信 的 问题 。 

在 掌握 了 Linux 程 序 设计 的 基础 之 后 ， 我 们 开始 讨论 图 形 化 程序 的 
创建 方法 。 我 们 将 通过 两 章 的 篇 幅 来 介绍 相关 内 容 。 首 先 介 绍 
GTK+ 工 具 包 ， 它 是 GNOME 开 发 环境 的 基础 ;然后 介绍 Qt 工具 包 ， 它 
是 KDE 开 发 环境 的 基础 。 

在 本 书 的 最 后 一 章 ， 我 们 简要 介绍 了 Linux 的 标准 ， 正 是 这 些 标准 
使 得 不 同 厂商 的 Linux 发 行 版 保持 了 足够 的 相似 性 ， 从 而 使 我 们 编写 的 
程序 可 以 在 不 同 的 Linux 发 行 版 上 运行 。 

正如 你 所 期 望 的 ， 本 书 还 包括 许多 其 他 内 容 ， 但 我 们 希望 这 里 给 
出 的 简单 介绍 能 够 让 你 对 将 讨论 的 内 容 有 一 个 清晰 的 概念 。 


准备 工作 


在 本 书 中 ， 我 们 将 给 予 读 者 一 种 Linux 程 序 设计 的 体验 。 为 了 更 好 
地 理解 各 章 的 内 容 ， 你 应 该 在 阅读 本 书 时 ， 实 际 运行 书 中 的 程序 示 
例 。 这 将 提供 一 个 很 好 的 编程 实践 体验 ， 并 将 启发 你 创建 自己 的 程 
序 。 我 们 希望 读者 一 边 阅 读 一 边 在 Linux 系 统 上 实际 操作 。 

Linux 可 以 用 在 许多 不 同 的 系统 上 。 其 适应 性 使 得 只 要 设备 中 有 一 
个 处 理 器 芯片 ，Linux 就 可 以 以 这 样 或 那样 的 方式 在 其 上 运行 。 可 以 运 
行 Linux 系 统 的 设备 包括 基于 Alpha、ARM ` IBM Cell ` Itanium ` PA- 
RISC、PowerPC、SPARC、SuperH、68k 以 及 各 种 X86 系列 处 理 器 (32 
位 和 64 位 ) 的 计算 机 。 

我 们 使 用 两 台 不 同 配置 的 Linux 系 统 来 编写 本 书 并 开发 书 中 的 程序 
示例 ， 所 以 我 们 可 以 确信 ， 只 要 你 的 机 器 可 以 运行 Linux， 你 就 可 以 很 
好 的 利用 本 书 。 此 外 ， 在 本 书 的 技术 审核 阶段 ， 我 们 还 在 其 他 版 本 的 
Linux 系 统 中 测试 了 书 中 的 全 部 代码 。 

我 们 在 编写 本 书 时 主要 使 用 的 是 基于 x86 的 系统 ， 但 我 们 所 讨论 的 
内 容 很 少 是 只 适用 于 x86 的 。 虽 然 在 一 人 台 有 8MB 内 存 的 486 机 器 上 运行 
Linux 也 是 可 能 的 ， 但 要 想 成 功 地 运行 一 个 现代 Linux 发 行 版 并 运行 本 


书 中 的 程序 示例 ， 我 们 建议 你 使 用 Fedora、openSUSE 或 Ubuntu 等 比较 
流行 的 Linux 发 行 版 的 最 新 版 本 ， 并 采用 它们 所 推荐 的 硬件 配置 。 

在 软件 需求 方面 ， 我 们 建议 使 用 你 偏爱 的 Linux 发 行 版 的 最 新 版 
本 ， 并 应 用 当前 更 新 (大 多 数 厂商 会 通过 自动 更 新 的 方式 在 线 提供 这 
些 更 新 ) 以 保证 你 的 系统 打上 了 所 有 的 补丁 。Linux 和 GNU 工 具 集 都 
是 以 GNU 通 用 公共 许可 证 (GPL) 的 形式 发 布 的 。 一 个 典型 的 Linux 发 
行 版 的 大 多 数 其 他 组 件 也 都 使 用 GPL 许 可 证 或 其 他 开放 源码 许可 证 之 
一 ， 这 意味 着 它们 都 具有 某 些 特性 ， 其 中 之 一 束 是 自由 。 它 们 的 源 代 
码 总 是 可 以 被 上 自由 获取 ， 没 有 人 可 以 剥夺 这 种 自由 。 关 于 GPL 的 详细 
资料 请 见 http: /www.gnu.org/licenses/。 关 于 开放 源码 定义 和 它 所 使 用 
的 各 种 许可 证 的 详细 资料 请 见 http://www.open-source.org/。 你 总 是 可 以 
获取 到 对 GNU/Linux 的 文 持 一 一 你 可 以 目 己 研究 源 代码 、 雇 用 他 人 或 
购买 厂商 的 付费 支持 。 


源 代码 


当 试验 本 书 中 的 程序 示例 时 ， 你 可 以 手工 输入 所 有 的 代码 ， 世 可 
以 使 用 和 本 书 配 套 的 源 代 码 文件 。 本 书 使 用 的 所 有 程序 源 代码 都 可 以 
从 http://www.wrox.com 上 下 载 。 在 该 网 站 中 ， 你 只 需 找 到 本 书 所 在 页 
E (通过 搜索 框 或 使 用 书 名 列表 ) ， 然 后 在 本 书 内 容 介 绍 页 面 点 击 
Download Code (下 载 代码 ) 链接 ， 就 可 以 获得 本 书 的 所 有 源 代 码 了 o 


因为 很 多 图 书 都 有 类 似 的 书 名 ， 所 以 通过 ISBN 搜 索 图 书 是 最 
佳 的 方式 。 本 书 的 ISBN 为 978-0-470-14762-7。 


在 下 载 了 源 代 码 之 后 ， 你 就 可 以 用 压缩 工具 对 其 解压 。 此 外 ， 你 
也 可 以 访问 Wrox RA 码 F & += 页 
(http: //www.wrox.com/dynamic/books/download.aspx) ， 获 取 本 书 和 
其 他 Wrox 图 书 的 源 代码 。 


代码 下 载 说 明 


我 们 尽力 加 读者 提供 能 够 清晰 前 明 书 中 所 讨论 概念 的 示例 程序 和 
代码 片段 。 需 要 指出 的 是 ， 为 了 尽 可 能 地 解释 清楚 书 中 介绍 的 新 功 
能 ， 我 们 将 采用 一 种 或 两 种 代码 风格 。 

特别 要 指出 的 是 ， 我 们 并 没有 对 调用 的 每 个 钞 数 的 返回 值 进行 检 
查 ， 以 判断 它 是 否 与 我 们 预期 的 一 样 。 在 真正 的 应 用 程序 代码 中 ， 我 


们 肯定 要 做 这 样 的 检查 工作 ， 而 读者 也 应 该 对 错误 处 理 采 取 产 格 的 措 
施 。 (本 书 的 第 3 章 将 讨论 一 些 捕获 和 处 理 错误 的 方法 。) 


GNU 通 用 公共 许可 证 
书 中 的 所 有 源 代 码 都 遵循 GNU 通 用 公共 许可 证 第 二 版 


( http://www.gnu.org/licenses/old-licenses/ gpl-2.0.html) 的 条 款 。 下 面 


的 许可 说 明 适 用 于 本 书 所 有 的 源 代 码 : 
This program is free software; you can redistribute it and/or modify 
of the GNU General Public License as published by 

n; either version 2 of the License, or 


This prc 


排版 约定 


为 了 帮助 读者 更 好 地 理解 本 书 内 容 ， 随 时 把 握 学 习 重 点 ， 全 书 将 
使 用 以 下 一 些 排版 约定 : 


书 中 像 这 样 的 文字 框 中 记录 的 是 一 些 重 要 的 、 不 应 该 被 态 记 
的 、 非 常 关键 的 信息 。 它 们 与 周边 的 内 容 直接 相关 。 
对 当前 讨论 内 容 的 技巧 、 提 示 、 容 门 和 旁白 都 会 像 这 样 缩 进 
放置 并 将 字体 设置 为 楷体 。 
当 我 们 进行 介绍 时 ， 我 们 将 把 一 些 重 要 的 单词 用 楷体 印刷 ， 需 要 
读者 输入 的 字符 用 粗 体 印刷 。 组 合 键 的 格式 为 : Ctrl+A。 
我 们 使 用 3 种 不 同 的 方式 来 印刷 代码 和 终端 会 话 : 


root ttyl Sep 
E 


“>. ^al ^ s fu 4 + rm + ` 
lck tty2 Sep 10 16:10 


对 于 命令 行 ， 它 的 样式 如 上 面 代 码 的 顶部 所 示 ， 而 它 的 输出 结 采 
则 以 常规 风格 印刷 。 字 符 $ 是 提示 符 (如 果 命 令 需 要 超级 用 户 来 执行 ， 
则 提示 符 会 用 字符 # 来 奉 代 ) ， 粗 体 字 的 文本 是 需要 读者 输入 的 命令 ， 
然后 按 下 回 车 键 执行 该 命令 。 其 后 采用 相同 字体 但 不 古 黑 体 的 所 有 文 
本 都 是 该 黑体 字 命 令 的 输出 。 在 上 面 的 例子 中 ， 你 输入 命令 who， 然 
后 将 在 命令 下 面 看 到 输出 的 结果 。 

Linux 定 义 的 函数 和 结构 的 原型 使 用 黑体 字 来 印刷 ， 如 下 所 示 : 


#include <stdio.h> 


int printf (const char *format, ...); 
ge Pine 带 有 底 纹 的 部 分 是 新 的 、 重 要 的 内 容 ， 如 
ZN: 
/* 这 样 印 刷 的 是 新 的 、 重 要 的 代码 。*/ 
而 如 有 果 代 码 采用 的 是 如 下 所 示 不 带 压 纹 的 风格 ， 或 表示 它 的 内 容 没 有 
那么 重要 : 
/* 这 样 印刷 的 是 以 前 出 现 过 的 代码 。*/ 
当 程序 代码 的 内 容 在 一 草 中 有 增加 时 ， 后 来 添加 的 代码 首次 出 现 
时 以 加 底 纹 的 风格 给 出 ， 其 后 就 不 再 加 底 纹 了 。 例 如 ， 一 个 新 的 程序 
如 下 所 示 : 
/* 代码 示例 */ 
/* 到 此 结束 */ 
如 果 我 们 在 该 章 的 稍 后 部 分 增加 了 这 个 程序 的 内 容 ， 新 增 代码 将 
市 有 底 纹 : 
/* 代码 示例 */ 
/* 这 一 行 和 下 一 行 “*] 
/* 是 新 增 的 代码 */ 
/* 到 此 结束 */ 
我 们 要 提 到 的 最 后 一 个 约定 是 ， 我 们 在 每 个 程序 示例 开始 之 前 都 
会 加 上 一 个 “实验 ”标题 ， 其 目的 是 为 了 将 代码 分 隔 开 ， 突 出 显示 其 组 
成 部 分 ， 同 时 可 以 显示 应 用 程序 的 进度 。 当 我 们 觉得 有 必要 时 ， 还 会 


在 代码 之 后 加 上 “实验 解析 ”部 分 ， 来 解释 代码 中 与 前 面 理论 有 关 的 关 
ak 我 们 发现 这 两 个 约定 有 助 于 把 非常 难于 理解 的 代码 清音 分 解 
对 人 简 HI 


勘误 表 


Sh ee 但 是 人 
无 完 人 ， 错 误 总 是 难免 的 。 如 有 果 你 找到 了 本 书 中 的 错误 ， 比 如 拼写 错 
误 或 代码 错误 ， 我 们 将 非常 感谢 可 以 得 到 你 的 反馈 。 指 正 错误 不 仅 可 
以 为 其 他 读者 节省 时 间 ， 同 时 也 可 以 帮助 我 们 提高 图 书 的 品质 。 

要 找到 本 书 的 勘误 表 ， 请 访问 http: /www.wrox.com， 人 然后 使 用 搜 
索 框 或 书 名 列表 来 找到 本 书 。 在 本 书 的 页 面 ， 点 击 Book Errata (RE 
ENRE) 链接 。 在 该 链接 指 癌 的 页 面 中 ， 你 可 以 看 到 由 Wrox 编 辑 发 布 
的 所 有 和 针对 本 书 提 交 的 勘误 。 你 也 可 以 通过 网 址 
http: //www.wrox.com/misc-pages/booklist.shtml 找 到 一 个 完整 的 图 书 列 
表 ， 其 中 包括 指向 每 本 书 勘误 表 的 链接 。 

如 采 在 本 书 的 勘误 表 中 没有 找到 你 发 现 的 错误 ， 可 以 访问 网 址 
http: //Wwww.wrox.com/contact/techsupport.shtml， 填 写 该 页 面 上 的 表格 
以 将 你 发 现 的 错误 发 送 给 我 们 。 。 我 们 将 检查 你 发 送 过 来 的 信息 c UD 

它 是 正确 的 ， 我 们 将 在 本 书 的 勘误 表 中 发 布 该 信息 ， 并 在 本 书 的 下 一 
版 中 修正 该 问题 。 


p2p.wrox.com 


为 参与 作者 和 同行 的 讨论 ， 你 可 以 加 入 P2P 论 坛 ， 它 的 网 址 是 
p2p.wrox.com。 这 个 论坛 是 一 个 基于 Web 的 系统 ， 你 可 以 在 其 上 发 布 
SA cu eS 忌 ， 并 与 其 他 读者 和 技术 用 户 交流 。 
这 个 论坛 还 提供 了 订阅 功能 ， 当 有 你 感 兴 趣 的 主题 发 布 时 ， 论坛 会 通 
过 电子 邮件 把 这 些 消 ee FAR © Wrox 的 作者 、 编 辑 、 其 他 行业 专家 
和 与 你 一 样 的 读者 都 会 到 这 个 论坛 探讨 一 些 问 题 。 
在 http: /p2p.wrox.com 中 ， 你 将 找到 很 多 不 同 的 论坛 ， 这 些 论 坛 
不 仅 有 助 于 你 阅读 本 书 ， 而 且 也 有 助 于 你 开发 自己 的 应 用 程序 。 e 要 加 
入 这 些 论坛 ， 你 只 需 按 如 下 步 又 操作 即 可 。 
(1) 访问 p2p.wrox.com 并 点 击 Register 链 接 。 
(2) 阅读 使 用 条 款 并 点 击 Agree 按 钮 。 
(3) 填写 加 入 论坛 所 必需 的 信息 和 你 想 要 提供 的 其 他 可 选 信息 ， 
然后 点 击 Submit 按 钮 。 


(4) 你 将 收 到 一 封 电子 邮件 ， 该 邮件 告诉 你 如 何 验 证 你 的 账号 并 
完成 加 入 程序 。 


注意 ， 不 加 入 P2P 论 坛 也 可 以 阅读 论坛 中 的 消息 ， 但 是 如 果 
你 想 要 发 布 自己 的 消息 ， 你 就 必须 加 入 论坛 。 


加 入 论坛 后 ， 你 就 可 以 发 布 新 消息 并 回复 其 他 用 户 发 布 的 消息 
了 。 你 可 以 在 任何 时 间 阅 读 Web 站 点 上 的 消息 。 如 果 希 望 某 个 论坛 能 
将 最 新 的 消息 通过 电子 邮件 发 送 给 你 ， 你 可 以 点 击 论坛 列表 中 该 论坛 
4% PRSFI21 4) Subscribe to this Forum 图 标 。 

要 获得 如 何 使 用 Wrox P2P 的 更 多 信息 ， 你 可 以 阅读 P2P FAQ 列 表 
中 的 问题 及 其 答复 ， 这 些 问 题 与 论坛 软件 的 工作 原理 及 很 多 与 P2P 和 
Wrox 图 书 相 关 的 常见 问题 有 关 。 要 阅读 FAQ， 你 可 以 点 击 任何 P2P 页 
面 上 的 FAQ 链 接 。 
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软件 环境 的 思想 (现在 它 已 通过 GNU/Linux 成 为 现实 ) 。 第 二 位 是 
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UNIX 有 何 关 系 。 我 们 将 市 领 你 了 解 Linux 开 发 系统 提供 了 哪些 机 制 ， 


并 且 编 写 和 运行 你 的 第 一 个 程序 。 在 本 章 中 ， 我 们 将 介绍 以 下 几 方 面 


的 内 容 : 
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UNIX ^ Linux 4llGNU 
Linux 程 序 及 其 编程 语言 
如 何 寻 找 开 发 资源 
静态 库 和 共享 库 
UNIX 哲 学 


1.1 UNIX ^ Linux#IGNUM ST 


近年 来 ，Linux 已 成 为 一 种 现象 。 几 乎 每 天 ，Linux 都 以 某 种 方式 
出 现在 媒体 上 。 我 们 已 经 数 不 清 在 Linux 上 有 和 多少 应 用 程序 以 及 有 多 少 
HLA (包括 一 些 政府 部 门 和 城市 管理 部 门 ) 在 使 用 Linux 了。 主要 的 硬 
fr] mg (如 IBM 和 Dell) 现在 都 已 支持 Linux， 主 要 的 软件 厂商 (如 
Oracle) 也 都 已 支持 他 们 的 软件 运行 在 Linux 之 上 。Linux 已 真正 成 为 一 
个 切实 可 行 的 操作 系统 ， 特 别 是 在 服务 絮 市 场 中 。 

Linux 的 成 功 要 归功 于 在 它 之 前 诞生 的 系统 和 应 用 程序 UNIX 
和 GNU 软 件 。 本 市 将 介绍 Linux 是 怎样 产生 的 ， 以 及 它 植 根 于 何 处 。 


1.1.1 人 是 UNIX 


UNIX 操 作 系 统 最 初 是 由 贝尔 实验 室 开 发 的 ， 当 时 的 贝尔 实验 室 是 
电信 业 巨 头 AT&T (美国 电报 电话 公司 ) 旗下 的 一 员 。UNIX 是 在 20 世 
纪 70 年 代为 DEC (数字 设备 公司 ) 的 PDP 系 列 计算 机 设计 的 ， 它 现在 
已 成 为 一 种 非常 流行 的 多 用 户 、 多 任务 操作 系统 。UNIX 操 作 系 统 可 以 
运行 在 大 量 不 同 种 类 的 硬件 平台 上 ， 其 适用 范围 从 PC 工作 站 一 直到 多 
处 理 器 服务 器 和 超级 计算 机 。 


1. UNIX E 


严格 来 说 ，UNIX 是 由 Open Group (开放 组 织 ) 管理 的 一 个 商标 ， 
它 指 的 是 一 种 遵循 特定 规范 的 计算 机 操作 系统 。 这 个 规范 也 称 为 单一 
UNIX 规 范 (The Single UNIX Specification) ， 它 定义 了 所 有 必需 的 
UNIX 操 作 系 统 函 数 的 名 称 、 接 口 和 行为 。 这 个 规范 在 很 大 程度 上 是 早 
期 由 IEEE (电气 和 电子 工程 师 协 会 ) 开发 的 P1003 或 POSIX 规 范 的 超 


许多 类 UNIX 系 统 都 是 具有 商业 性 质 的 ， 如 IBM 的 AIX、HP 的 HP- 
UX 和 Sun 的 Solaris。 还 有 一 些 可 以 免费 获得 ， 如 FreeBSD 和 Linux。 如 
今 只 有 少数 系统 完全 遵守 开放 组 织 的 规范 ， 从 而 允许 它们 挂 上 
“UNIX” 的 商标 。 

在 过 去 ,不同 UNIX 系 统 之 间 的 兼容 性 一 直 是 一 个 实际 存在 的 问 
题 ， 尽 管 POSIX 规 范 在 这 一 方面 起 了 很 大 的 帮助 。 现 在 ， 通 过 遵守 一 
些 简单 的 规则 ， 创 建 可 以 运行 在 所 有 UNIX 和 类 UNIX 系 统 上 的 应 用 程 


序 已 成 为 可 能 。 天 于 Linux 和 UNIX 标 准 的 更 多 细节 内 容 可 以 在 本 书 的 
第 18 草 中 找到 o 


2. UNIXTI X 


在 后 续 的 章节 里 ， 我 们 希望 能 够 癌 读者 传达 一 种 Linux (UNIX) 
程序 设计 的 风格 。 虽 然 不 管 在 哪 种 平台 上 用 C 语 言 编 程 在 很 多 方面 都 
， 但 UNIX 和 Linux 开 发 者 对 编程 和 系统 开发 确实 有 其 独特 的 
MLK o 

UNIX 操 作 系统 (包括 Linux) S — PARE SEES o P EA 
出 了 一 些 典 型 的 UNIX 程 序 和 系统 所 具有 的 特点 。 

O 简单 性 : 许多 很 有 用 的 UNIX 工 具 是 非常 简单 的 ， 因 此 也 是 很 

小 并 易于 理解 的 。“ 小 而 简单 ” (KISS: Keep It Small and 

Simple) 是 一 种 值得 学 习 的 技术 。 越 大 、 越 复杂 的 系统 注定 包含 

越 大 、 越 复杂 的 错误 ， 而 调试 是 我 们 所 有 人 都 想 避 免 的 将 差事 。 

口 集中 性 : 通常 ， 让 一 个 程序 很 好 地 执行 一 项 任务 要 好 过 把 所 

有 功能 都 乱七八糟 地 堆 在 一 起 。 功 能 肥 肿 的 程序 难于 使 用 和 维 

护 ， 只 有 单一 目标 的 程序 更 容易 随 着 更 好 的 算法 或 界面 被 开发 出 

来 而 得 到 改进 。 在 UNIX 中 ， 当 用 户 出 现 新 的 需求 时 ， 我 们 通常 是 

把 小 工具 组 合 起 来 以 完成 更 复杂 的 任务 ， 而 不 是 试图 将 一 个 用 户 

期 望 的 所 有 功能 放 在 一 个 大 程序 里 。 

o 可 重用 组 件 : 将 应 用 程序 的 核心 实现 为 库 。 具 有 简单 而 灵活 

的 编程 接口 、 文 档 齐 备 的 库 可 以 帮助 其 他 人 开发 出 同类 程序 ， 或 

者 把 这 些 技术 应 用 到 新 的 应 用 领域 。dbm 库 就 是 一 个 例子 ， 它 是 

一 组 可 重用 的 函数 ， 而 不 是 单一 的 数据 库 管 理 程序 。 

O 过 滤器 : 许多 UNIX 应 用 程序 可 用 作 过 滤器 。 也 就 是 说 ， 它 们 

对 输入 进行 转换 并 产生 输出 。 正 如 你 将 在 后 面 看 到 的 ，UNIX 提 供 

了 一 些 机 制 ， 让 我 们 可 以 把 一 些 UNIX 程 序 通 过 一 种 新 家 的 方式 组 

合 起 来 ， 以 开发 出 相当 复杂 的 应 用 程序 。 当 然 ， 这 种 类 型 的 重用 

是 靠 我 们 前 面 提 到 的 开发 方法 文 撑 的 。 

O 开放 的 文件 格式 : 比较 成 功 并 流行 的 UNIX 程 序 都 使 用 纯 

ASCII 码 的 文本 文件 或 XML 文件 作为 配置 文件 和 数据 文件 。 如 采 

你 在 开发 程序 时 采用 了 任 一 种 做 法 ， 那 你 做 对 了 1! 它 使 用 户 可 以 

用 标准 工具 来 修改 和 搜索 配置 项 ， 并 且 可 以 开发 出 狐 工 具 在 数据 

文件 上 执行 新 的 功能 。ctags 源 代码 交叉 引用 系统 就 是 一 个 好 例 
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O 灵活 性 : 你 不 能 期 待 用 户 都 能 非常 正确 地 使 用 你 的 程序 。 所 
以 ， 你 在 编程 时 应 尽量 考虑 到 灵活 性 ， 尽 量 避 人 免 随 意 限 制 字段 长 
度 或 记录 数目 。 如 果 你 能 做 到 的 话 ， 则 你 编写 的 网 络 程序 既 能 在 
al um 也 能 跨 网 络 运行 。 永 远 不 要 认为 你 知道 用 户 想 做 的 
Jj o 


1.1.2 人 是 Linux 


可 能 你 已 经 知道 ，Linux 是 一 个 可 以 自由 发 布 的 类 UNIX 内 核实 
现 ， 它 是 一 个 操作 系统 的 底层 核心 。 因 为 Linux 以 UNIX 系 统 为 其 灵感 
来 源 ， 所 以 Linux 程 序 和 UNIX 程 序 是 非常 相似 的 。 事 实 上 ， 几 乎 所 有 
为 UNIX 编 写 的 程序 都 可 以 在 Linux 上 编译 运行 。 而 且 ， 一 些 专用 于 
UNIX 商 业 版 本 的 商业 应 用 软件 ， 也 可 以 不 加 改变 地 以 二 进 制 形式 运行 
在 Linux 系 统 上 ° 

Linux ze HR 3E ZEAE AU Linus Torvalds 开 发 的 ， 期 间 得 到 了 因 特 
网 上 广大 UNIX 程 序 员 的 帮助 。 它 最 初 只 是 受 Andy Tanenbaum 教 授 的 
Minix (一 个 小 型 的 类 UNIX 系 统 ) 启发 而 开发 的 程序 ， 纯 属 个 人 爱 
好 ， 但 后 来 它 自 壬 逐步 发 展 成 为 一 个 完整 的 系统 。 其 开发 目的 是 保证 
Linux 除 包含 可 以 自由 发 布 的 代码 外 ， 不 会 集成 任何 专 有 代码 。 

现在 ， 使 用 不 同类 型 CPU 的 计算 机 系统 都 有 Linux 的 版 本 可 以 运行 
其 上， 包括 基于 32 位 和 64 位 Intel x86 及 其 兼容 处 理 絮 的 个 人 计算 机 、 使 
用 SUN SPARC ` IBM PowerPC ` AMD Opteron ^ Intel Itanium 的 工作 站 
和 服务 器 ， 甚 至 一 些 手持 PDA 和 Sony PS2/PS3 游 戏 机 。 只 要 这 个 设备 
有 处理 絮 ， 就 会 有 人 试图 让 Linux 运 行 其 上 。 


1.1.3 GNU 项 基金 会 


Linux 能 够 存在 并 发 展 到 今天 是 无 数 人 共同 努力 的 结果 。 操 作 系 统 
内 核 本 喘 仅 仅 是 可 用 开发 系统 的 一 小 部 分 。 传 统 上 ， 商 业 化 的 UNIX 系 
统 都 包含 提供 系统 服务 和 工具 的 应 用 程序 。 对 Linux 系 统 来 说 ， 这 些 额 
外 的 程序 是 由 许多 程序 员 编 写 并 自由 发 布 的 。 

Linux 社 区 (以 及 其 他 的 软件 开发 组 织 ) 支持 自由 软件 的 概念 ， 即 
软件 本 身 不 应 受 限 ， 它 们 应 遵守 GNU (GNU 是 GNU’s Not UNIX 的 递 
归 缩 写 ) 通用 公共 许可 证 (GPL) 。 虽 然 获得 软件 可 能 要 支付 一 定 的 
但 此 后 就 可 以 随意 使 用 它们 ， 并 且 它 们 通常 是 以 源 代码 的 形式 


自由 软件 基金 会 (Free Software Foundation) Richard Stallman 创 | 
立 ， 他 是 UNIX 及 其 他 系统 上 最 著名 的 文本 编辑 软件 之 一 GNU Emacs 
的 开发 者 。Stallman 是 自由 软件 这 一 概念 的 倡导 者 ， 并 发 起 了 GNU 项 
H, OSMAN Ree: 试图 创建 一 个 与 UNIX 系 统 兼 容 ， 但 并 不 受 
UNIX 名 字 和 源 代 码 私 有 权限 制 的 操作 系统 和 开发 环境 。 可 能 有 一 天 ， 
GNU 处 理 硬件 和 管理 运行 程序 的 方式 会 变 得 与 UNIX 完 全 不 同 ， 但 它 
仍然 会 继续 支持 UNIX 类 型 的 应 用 程序 。 

GNU 项 目 已 为 软件 社区 提供 了 许多 UNIX 系 统 上 应 用 程序 的 仿制 
品 。 所 有 这 些 程 序 ， 即 GNU 软 件 ， 都 是 在 GNU 通 用 公共 许可 证 

(GPL) 的 条 款 下 发 布 的 。 你 可 以 在 http: /www.gnu.org 上 找到 该 许可 

证 的 一 份 副 本 。 这 份 许可 证 阐述 了 copyleft 《copyleft 是 一 个 生 造 的 
词 ， 是 英文 copyright 的 反 话 ) 的 概念 。copyleft 的 目的 是 防止 有 人 给 自 
由 软件 的 使 用 加 上 限制 。 

下 面 是 在 GPL 条 款 下 发 布 的 一 些 主 要 的 GNU 项 目 软件 。 
GCC: GNU 编 译 器 集 ， 它 包括 GNU C 编 译 器 。 
G++: C++ 编译 器 ， 是 GCC 的 一 部 分 。 
GDB: 源 代 码 级 的 调试 器 。 
GNU make: UNIX make 命 令 的 免费 版 本 。 
Bison: SUNIX yacca BJ DAT ENT AE Boss ° 
bash: 命令 解释 器 (shell) ° 
O GNU Emacs: 文本 编辑 器 及 环境 。 

许多 其 他 的 软件 包 也 是 在 遵守 自由 软件 的 原则 和 GPL 条 于 的 情况 
下 开发 和 发 行 的 ， 包 括 电 子 表格 、 源 代码 控制 工具 、 编 译 占 和 解释 
器 、 因 特 网 工具 、 图 形 图 像 处 理工 具 (如 Gimp) ， 以 及 两 个 完整 的 基 
于 对 象 的 环境 (GNOME 和 KDE) 。 我 们 将 在 第 16 章 和 第 17 章 讨论 
GNOME 和 KDE 。 

现在 有 这 么 多 可 用 的 自由 软件 ， 再 加 上 Linux 内 核 ， 我 们 可 以 说 : 
创建 一 个 GNU 的 、 自 由 的 类 UNIX 系 统 的 目标 已 经 通过 Linux 系 统 实现 
了 。 由 于 认识 到 GNU 软 件 所 做 出 的 贡献 ， 现 在 许多 人 通常 都 把 Linux 
系统 称 为 GNU/Linux ° 

你 可 以 在 http: /www.gnu.org 上 找到 更 多 关于 目 由 软件 的 概念 。 


1.1.4 Linux 发 行 版 


正如 我 们 前 面 提 到 的 ，Linux 实 际 上 只 是 一 个 内 核 。 你 可 以 获得 内 
核 源 代码 ， 编 译 并 安装 它 ， 然 后 获得 并 安 厂 许多 其 他 目 由 发 布 的 软 
件 ， 从 而 完成 一 个 完整 Linux 系 统 的 安 狠 。 我 们 通常 将 这 样 安 狠 所 得 的 


口 口 口 口 口 口 


系统 称 为 Linux 系 统 ， 这 是 因为 它 包 含 的 远 不 止 一 个 Linux 内 核 。 系 统 
中 大 多 数 的 工具 都 来 自 于 目 由 软件 基金 会 的 GNU 项 目 。 

你 可 能 会 意识 到 ， 仅 从 源 代 码 开 始 创 建 Linux 系 统 是 一 件 很 不 容易 
的 事 。 幸 运 的 是 ， 许 多 人 制作 了 准备 好 安装 的 Linux 发 行 版 (通常 称 为 
flavor) ， 它 一 般 可 下 载 或 以 CD-ROM/DVD 为 载体 。 它 不 仅 包 含 内 
核 ， 还 包含 许多 其 他 编程 工具 和 应 用 程序 。 它 通常 都 会 包含 一 个 X 视 
窗 系统 的 实现 ， 即 在 许多 UNIX 系 统 上 都 有 的 一 个 图 形 化 环境 * Linux 
发 行 版 通常 还 带 有 安装 程序 和 附加 文档 (这 些 一 般 也 都 在 CD 上 ) ， 帮 
助 你 安装 上 自己 的 Linux 系 统 。 一 些 著名 的 Linux 发 行 版 (特别 是 在 Intel 
X86 系列 处 理 器 上 的 发 行 版 ， 有 Red Hat Enterprise Linux 及 其 社区 开发 
hi HJ Fedora ^ Novell SuSE Linux 及 其 免费 的 openSUSE 变 体 、Ubuntu 
Linux、Slackware、Gentoo 和 Debian GNU/Linux， 更 多 Linux 发 行 版 的 
详细 信息 可 访问 Distro Watch 网 站 http: //distrowatch.com ° 


1.2 Linux 程 序 设 1 | 


许多 人 认为 Linux 程 序 设计 就 是 用 C 语 言 编程 。 的 确 ，UNIX 最 初 
是 用 C 语 言 编写 的 ， 并 且 UNIX 的 大 多 数 应 用 程序 也 是 用 C 语 言 编写 
的 ， 但 C 语 言 并 不 是 Linux 程 序 员 或 UNIX 程 序 员 的 唯一 选择 。 在 本 书 
中 ， 我 们 将 介绍 几 种 其 他 的 选择 。 


事实 上 ，UNIX 的 第 一 个 版 本 是 在 1969 年 用 PDP7 机 器 的 汇编 
语言 编写 的 。 差 不 多 也 在 个 时 候 ，Dennis Ritchie HT CAF, 
并 于 1973 年 与 Ken Thompson 一 起 用 C 语 言 重 写 了 整个 UNIX 内 
S a 汇编 语言 编写 的 时 代 的 确 是 个 了 


对 Linux 系 统 来 说 ， 有 各 种 各 样 的 编程 语言 可 供 先 用， 其 中 许多 是 
免费 的 ， 它 们 可 以 通过 CD-ROM 光 盘 获 得 或 在 因特网 上 通过 FTP 站 点 
下 载 。 ud AQ ME S 
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我 们 将 在 第 2 章 回 读者 显示 如 何 用 Linux 的 shell (bash) 来 开发 小 
规模 到 中 等 规模 的 应 用 程序 。 在 本 书 的 其 他 章节 ， 我 们 主要 集中 在 C 
语言 上 。 我 们 将 集中 精力 从 C 语 言 程序 员 的 视角 探究 Linux 编 程 接口 。 
我 们 假设 读者 具备 C 语 言 编 程 的 基础 。 


1.2.1 Linux 程序 


Linux 应 用 程序 表现 为 两 种 特殊 类 型 的 文件 : 可 执行 文件 和 脚本 文 
件 。 可 执行 文件 是 计算 机 可 以 直接 运行 的 程序 ， 它 们 相当 于 Windows 
中 的 .exe 文 件 。 脚 本 文件 是 一 组 指令 的 集合 ， 这 些 指令 将 由 男 一 个 程 
Pe ( 即 解释 器 ) 来 执行 ， 它 们 相当 于 Windows 中 的 .bat 文 件 、.cmd 文 件 
或 解释 执行 的 BASIC 程 序 。 


Linux 并 不 要 求 可 执行 文件 或 脚本 文件 具有 特殊 的 文件 名 或 扩展 
名 。 文 件 系统 属性 (我 们 将 在 第 2 章 中 讨论 ) 用 来 指明 一 个 文件 是 否 为 
可 执行 的 程序 。 在 Linux 中 ， 你 可 以 用 编译 过 的 程序 代替 脚本 (反之 亦 
SR) 而 不 会 影响 其 他 程序 或 调用 者 。 事 实 上 ， 在 用 户 级 别 ， 这 两 者 本 
质 上 没有 任何 不 同 。 

当 登 录 进 Linux 系 统 时 ， 你 与 一 个 shell 程 序 (通常 是 bash) 进行 交 
互 ， 它 像 Windows 中 的 命令 提示 窗口 一 样 运行 程序 。 它 在 一 组 指定 的 
目录 路 人 径 下 按照 你 给 出 的 程序 名 搜索 与 之 同名 的 文件 。 搜 索 的 日 录 路 
径 存 储 在 shell 变 量 PATH 里 ， 这 一 点 与 Windows 也 很 类 似 。 搜 索 路 径 

(你 也 可 以 添加 这 个 路 径 ) 由 系统 管理 员 配 置 ， 它 通常 包含 如 下 一 些 

存储 系统 程序 的 标准 路 径 。 

O /bin: 二 进 制 文件 目 孙 ， 用 于 存放 启动 系 统 时 用 到 的 程序 。 

/usr/bin: 用 户 二 进 制 文件 目 孙 ， 用 于 存放 用 户 使 用 的 标准 程 


Y 
O /usr/local/bin: 本 地 二 进 制 文 件 目 录 ， 用 于 存放 软件 安装 的 程 
Y o 
系统 管理 员 (例如 root 用 户 ) 登录 后 使 用 的 PATH 变量 可 能 还 包含 
存放 系统 管理 程序 的 目 永 ， 如 /sbin 和 /usrsbin ° 

可 选 的 操作 系统 组 件 和 第 三 方 应 用 程序 可 能 被 安装 在 /opt 目 隶 
下 ， 安 闭 程 序 可 以 通过 用 户 安 奢 脚 本 将 路 径 添 加 到 PATH 环境 变量 中 。 


从 PATH 中 删除 目录 并 不 是 一 个 好 主意 ， 除 非 确信 你 了 解 这 


么 做 的 后 果 。 


注意 ，Linux 像 UNIX 一 样 ， 使 用 冒号 6) 分 隔 PATH 变 量 里 的 条 
目 ， 而 不 是 像 MS-DOS 和 Windows 使 用 分 号 (; ) 。 (UNIX 使 用 冒 
号 : 在 先 ， 所 以 应 该 问 微软 为 什么 Windows 要 采用 不 同 的 方式 ， 而 不 
是 问 UNIX 为 什么 与 之 不 同 ! ) 下 面 是 一 个 PATH 变量 的 例子 : 
asr/local/bin:/bin:/usr/bin:.:/home/neil/bin:/usr/XllR6/bin 

上 面 的 PATH 变量 包含 的 条 目 有 : 标准 程序 存放 位 置 、 当 前 目录 
() 、 一 个 用 户 的 家 目 孙 和 X 视 窗 系 统 的 目 孙 。 


WIE, Linux IER () 分 隔 文件 名 里 的 目录 名 ， 而 不 是 
te (\) 。 而 且 这 次 还 是 UNIX 的 用 法 在 


1.2.2 X7 iHa 
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本 书 的 两 位 作者 都 喜欢 Emacs， 所 以 我 们 建议 你 花 一 点 时 间 来 学 
习 这 个 功能 强大 的 编辑 器 。 几 乎 所 有 的 Linux 发 行 版 都 将 Emacs 作为 可 
选 的 安装 包 ， 你 也 可 以 从 GNU 网 站 http: /www.gnu.orfg 上 得 到 它 ， 或 
者 在 XEmacs 网 站 http: //www.xemacs.org 上 得 到 它 的 图 形 化 环境 版 本 。 

要 更 深入 地 学 习 Emacs， 你 可 以 使 用 它 的 在 线 指 南 。 首 先 运 行 
emacs 命 令 以 启动 编辑 器 ， 然 后 输入 Ctrl+H， 接 着 输入 字母 束 进 入 了 
在 线 指南 。Emacs 也 有 完整 的 用 户 手 册 。 在 Emacs 中 输入 Ctrl+H， 接 着 
输入 字母 i 即 可 以 得 到 相关 信息 。 有 些 版 本 的 Emacs 可 能 包含 访问 手册 
和 指南 的 菜单 。 


1.2.3 Cif antes 


fEPOSIXHRAN ASH, CA Saat as PR A c89 » AE, CE 
言 编译 絮 被 简称 为 cc。 许 多 年 来 ， 不 同 厂 商 销 售 的 类 UNIX 系 统 中 所 带 
的 C 语 言 编 译 絮 均 包 含 不 同 的 功能 和 选项 ， 但 它们 一 般 都 称 为 cc 。 

在 准备 起 草 POSIX 标 准时 ， 事 实 上 已 经 不 可 能 制订 出 兼容 所 有 广 
商 的 标准 cc 命令 了 了。 于 是 ，POSIX 委 员 会 决定 为 C 语 言 编 译 絮 创建 莉 的 
标准 命令 ， 这 束 是 c89。 只 要 使 用 这 个 命令 ， 在 任何 机 器 上 ， 它 的 编译 
选项 都 相同 。 

Linux 系 统 尽量 实现 这 些 标准 。 在 Linux 系 统 中 ， 你 会 发 现 c89、cc 
和 gcc 这 些 命令 全 部 或 部 分 地 指向 系统 的 C 语 言 编 译 絮 ， 通 常 是 GNU C 
编译 絮 ， 或 gcc。 在 UNIX 系 统 中 ，C 语 言 编 译 絮 几乎 总 被 称 为 cc。 

在 本 书 中 ， 我 们 将 使 用 gcc， 这 是 因为 它 随 Linux 的 发 行 版 一 起 提 
供 ， 并 且 它 文 持 C 语 言 的 ANSI 标 准 语法 。 如 果 你 发 现 你 的 UNIX 系 统 
没有 gcc， 我 们 建议 你 设法 获取 并 安装 它 。 你 可 以 在 
http: //www.gnu.org 上 找到 它 ° 我 们 在 本 书 中 用 到 gcc 之 处 ， 你 都 可 以 
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实 验 你 的 第 一 个 Linux C 语 言 程 序 
在 本 例 中 ， 通 过 编写 、 编 译 和 运行 你 的 第 一 个 Linux 程 序 来 开始 
Linux 的 C 语 言 程序 开发 之 旅 。 还 是 从 最 有 名 的 Hello World 程 序 开始 


吧 
(1) 下 面 是 文件 hello.c 的 源 代码 : 


#include <stdio.h> 


#include <stdlib.h> 


int main( 


printf("Hello World\n"); 
exit(0); 


) 
(2) 编译 、 链 接 和 运行 程序 。 


$ gcc -o hello hello.c 


S ./hello 


Hello World 


e 
> 


试验 解析 

你 调用 GNU C 语 言 编 译 器 (在 Linux 中 ， 大 多 数 情况 下 用 cc 也 可 
EA) 将 C 语 言 源 代码 转换 为 可 执行 文件 hello。 然 后 运行 这 个 程序 ， 它 
将 打印 出 欢迎 信息 。 虽 然 这 只 是 最 简单 的 一 个 例子 ， 但 如 采 在 你 的 系 
统 上 能 做 到 这 一 点 ， 你 就 能 编译 、 运 行 本 书 中 以 后 所 有 的 例子 了 。 如 
果 无 法 完成 上 述 操 作 ， 请 检查 你 的 系统 以 确保 已 安装 了 C 语 言 编译 
器 。 例 如 ， 许 多 Linux 发 行 版 有 个 名 为 Software Development (软件 开 
A) 的 安装 选项 (或 类 似 选 项 ) ， 你 应 该 在 Linux 系 统 安 装 过 程 中 选中 
该 项 ， 从 而 确保 安装 了 所 需 的 软件 包 。 

因为 这 是 你 运行 的 第 一 个 程序 ， 所 以 有 些 问 题 最 好 现在 就 指出 
来 。hello 程 序 很 可 能 在 你 的 家 目录 中 。 如 采 PATH 变 量 不 包含 指 癌 你 的 
家 目录 的 条 目 ，shell 束 找 不 到 hello 程 序 。 更 进一步 ， 如 果 PATH 变 量 中 
包含 的 其 中 一 个 目录 包 舍 男 一 个 名 为 hello 的 程序 ，shell 束 会 执行 那个 
程序 。 如 果 PATH 中 这 样 的 目录 出 现在 你 的 家 目录 之 前 ， 这 种 情况 也 会 
发 生 。 为 了 避免 这 种 潜在 的 问题 ， 你 可 以 在 程序 名 前 加 上 一 个 ./( 例 


如 .jhello) 。 它 特别 指示 shell 去 执行 当前 目录 下 给 定名 称 的 程序 。 (FF 
号 .代表 当前 目录 。) | 

如 果 你 起 记 用 -o name 选 项 告诉 编译 絮 可 执行 程序 的 名 字 ， 编 译 姨 
就 会 把 程序 放 在 一 个 名 为 aout 的 文件 里 (a.out 的 含义 是 assembler 
output， 即 汇编 输出 ) 。 如 果 你 确信 编译 了 一 个 程序 但 又 找 不 到 它 ， 
别 乐 了 看 看 有 没有 a.out 文 件 ! 在 UNIX 的 早期 历史 中 ， 想 在 系统 上 玩 游 
戏 的 人 通常 把 游戏 作为 a.out 来 运行 ， 以 避免 被 系统 管理 员 捉 到 ， 因 此 
一 些 UNIX 系 统 每 晚会 定期 地 删除 所 有 名 为 a.out 的 文件 。 


1.2.4 AZINE L b 


对 Linux 开 发 人 员 来 说 ， 了 解 软件 工具 和 开发 货源 在 系统 中 存放 的 
位 置 是 很 重要 的 。 以 下 几 市 将 简单 介绍 一 些 重 要 的 目录 和 文件 。 


1. 应 用 程序 


应 用 程序 通常 存放 在 系统 为 之 你 留 的 特定 目录 中 。 系 统 为 正常 使 
用 提供 的 程序 ， 包 括 用 于 程序 开发 的 工具 ， 都 可 在 目录 /usr/bin 中 找 
到 ; 系统 管理 员 为 某 个 特定 的 主机 或 本 地 网 络 添 加 的 程序 通常 可 在 目 
孙 /usrlocalbin 或 /opt 中 找到 ° 

系统 管理 员 一 般 喜 欢 使 用 /opt 和 和 /usr/local 目 录 ， 因 为 它们 分 离 了 三 
商 提 供 及 后 续 添 加 的 文件 与 系统 本 身 提 供 的 应 用 程序 。 一 直 保 持 以 这 
种 方式 组 织 文 件 的 好 处 在 你 需要 升级 操作 系统 时 残 可 以 看 出 来 了 ， 
为 只 有 目录 /opt 和 /usr/local 里 的 内 容 需 要 你 留 。 我 们 建议 对 于 系统 级 的 
应 用 程序 ， 你 可 以 将 它 放 在 /usr/local 目 录 中 来 运行 和 访问 所 需 的 文 
件 。 对 于 开发 用 和 个 人 的 应 用 程序 ， 最 好 在 你 的 家 目录 中 使 用 一 个 文 
件 夹 来 存放 它 。 

其 他 一 些 功能 特性 和 编程 系统 可 能 有 其 自己 的 目录 结构 和 程序 目 
录 。 其 中 最 主要 的 一 个 就 是 X 视 窗 系 统 ， 它 通常 安装 在 /usr/X11 
或 /usr/bin/X11 目 录 中 。Linux 发 行 版 通常 使 用 X 视 窗 系统 的 X.Org 基金 
会 版 本 ， 它 基于 修订 版 7 (X11R7) 。 其 他 类 UNIX 系 统 可 能 选择 X 视 
窗 系 统 的 其 他 版 本 ， 它 们 被 安装 到 不 同 的 位 置 ， 如 Solaris 提 供 的 Sun 
Open Windows 被 安装 到 /usr/openwin 目 录 中 。 

”GNU 编 译 系 统 的 驱动 程序 gcc 〈 你 已 在 本 章 前 面 的 编程 示例 中 用 
过 ) 一 般 位 于 /usr/bin 或 /usr/local/bin 目 好 中 ， 但 它 会 从 其 他 位 置 运行 
各 种 编译 怖 文 持 的 应 用 程序 。 这 个 位 置 是 在 编译 编译 如 本 喘 时 指定 
的 ， 并 且 它 随 主机 类 型 的 不 同 而 不 同 。 对 Linux 系 统 来 说 ， 这 个 位 置 可 


能 是 /usrlib/gcc/ 目 录 下 的 一 个 版 本 特定 的 子 目 录 。 在 撰写 本 书 时 ， 这 
个 目录 在 本 书 其 中 一 位 作者 的 机 器 上 是 /usr/lib/gcc/i586-suse- 
linux/4.1.3。GNU C/C++ 编译 器 的 各 个 工具 和 GNU 专 用 的 头 文 件 都 保 
存在 这 里 。 


2. 头 文件 


用 C 语 言及 其 他 语言 进行 程序 设计 时 ， 你 需要 用 头 文件 来 提供 对 
常量 的 定义 和 对 系统 函数 及 库 函 数 调 用 的 声明 。 对 C 语 言 来 说 ， 这 些 
头 文 件 几乎 总 是 位 于 /srwinclude 目 孙 及 其 子 目 了 永 中 。 那 些 依赖 于 特定 
版 本 的 头 文件 通常 可 在 目 孙 /uswinclude/sys 和 /uswinclude/linux 中 
找到 。 

其 他 编程 系统 也 有 各 目的 头 文 件 ， 这 些 头 文件 被 存储 在 可 被 相应 
编译 器 自动 搜索 到 的 目录 里 。 例 如 ，X 视 窗 系 统 的 /usr/include/Xll 目 录 
和 GNU C++ 的 /usr/include/c++ 目 录 。 

在 调用 C 语 言 编译 器 上 时， 你 可 以 使 用 -| 标志 来 包含 保存 在 子 日 录 或 
非 标 准 位 置 中 的 头 文 件 。 例 如 : 


sy! 


Eta oat as MEENEEM E, 24 /usr/openwin/include H 5x FP ARTE 
序 fred.c 中 包含 的 头 文 件 。 请 参看 C 语 言 编 译 器 的 使 用 手册 (man gcc) 
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用 grep 命 令 来 搜索 包含 某 些 特定 定义 和 函数 原型 的 头 文 件 是 很 方 
便 的 。 假 设想 知道 用 于 从 程序 中 返回 退出 状态 定义 的 名 字 ， 你 只 需 切 
换 到 /usr/include 目 如 下 ， 然后 用 grep 命 令 搜 索 可 能 的 名 字 部 分 ， 如 下 所 
7: 


grep EXIT *.h 


$ gcc -I/usr/openwin/include fred.c 


上 上 面 的 grep 命 令 在 当前 目录 下 的 所 有 以 .h 结 尾 的 文件 中 搜索 字符 串 
EXIT_。 在 本 例 中 ， 它 在 stdlib.h 文 件 中 找到 了 你 需要 的 定义 。 


3. 库 文件 


库 是 一 组 预 完 编译 好 的 函数 的 集合 ， 这 些 函 数 都 古 按照 可 重用 的 
原则 编写 的 。 它 们 通常 由 一 组 相互 关联 的 函数 组 成 以 执行 某 项 第 见 的 


任务 ， 比 如 屏幕 处 理 函 数 库 〈curses 和 ncurses 库 ) 和 数据 库 访 问 例 程 
(dbm 库 ) 。 我 们 将 在 后 续 的 章节 中 介绍 一 些 函 数 库 。 

标准 系统 库 文 件 一 般 存 储 在 /lib 和 msrvlib 目 录 中 。C 语 言 编译 器 
(或 更 确切 地 说 是 链接 程序 ) 需要 知道 要 搜索 哪些 库 文 件 ， 因 为 在 默 
认 情 况 下 ， 它 只 搜索 标准 C 语 言 库 。 这 是 从 那个 计算 机 速度 还 很 慢 而 
且 CPU 运 行 周 期 还 很 昂 贯 的 时 代 遗 留 下 来 的 问题 。 仅 把 库 文 件 放 在 标 
准 目 了 永 中 ， 就 希望 编译 需 能 够 找到 它 是 不 够 的 ， 库 文件 必须 遵循 特定 
的 命名 规范 并 且 需 要 在 命令 行 中 明确 指定 。 

库 文 件 的 名 字 总 是 以 jb 开头 ， 随 后 的 部 分 指明 这 是 什么 库 C] 
如 ，c 代 表 C 语 言 库 ，m 代 表 数 学 库 ) 。 文 件 名 的 最 后 部 分 以 .开始 ， 然 
后 给 出 库 文 件 的 类 型 ; 

O .a 代表 传统 的 静态 函数 库 ; 

口 、.so 代 表 共 享 函 数 库 ( 见 后 面 的 解释 ) 。 

函数 库 通常 同时 以 静态 库 和 共享 库 两 种 格式 存在 ， 你 可 用 lsusrvlib 
命令 查看 。 你 可 以 通过 给 出 完整 的 库 文件 路 径 名 或 用 -1 标志 来 告诉 编 
译 器 要 搜索 的 库 文 件 。 例 如 : 


$ gcc -o fred fred.c /usr/lib/libm.a 


这 条 命令 要 求 编译 器 编译 文件 fred.c， 将 编译 产生 的 程序 文件 命名 
为 fred， 并 且 除 了 搜索 标准 的 C 语 言 钞 数 库 外 ， 还 搜索 数学 库 以 解决 瑟 
数 引 用 问题 。 下 面 的 命令 也 能 产生 类 似 的 结果 : 


$ gcc -o fred fred.c -lm 


-1m (在 字母 1 和 m 之 间 没 有 空格 ) 是 简写 方式 〈 简 写 在 UNIX 环 境 
里 很 有 用 ) ， 它 代表 的 是 标准 库 目 录 (本 例 中 是 /usrlib) 中 名 为 libm.a 
。 -1m 标 志 的 另 一 个 好 处 是 如 果 有 共享 库 ， 编 译 器 会 自动 选 
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虽然 库 文件 和 头 文 件 一 样 ， 通 常 都 保存 在 标准 位 置 ， 但 你 也 可 以 
通过 使 用 -L (大 写字 母 ) 标志 为 编译 器 增加 库 的 搜索 路 径 。 例 如 : 


$ gcc -o xllfred -L/usr/openwin/lib xlifred.c -1X11 


这 条 命令 用 /usr/openwim/lib 目 录 中 的 libX11 库 版 本 来 编译 和 链接 程 
序 xllfred ° 


函数 库 最 简单 的 形式 是 一 组 处 于 “准备 好 使 用 ”状态 的 目标 文件 。 
当 程 序 需 要 使 用 函数 库 中 的 某 个 函数 时 ， 它 包含 一 个 声明 该 函数 的 头 
文件 。 编译 器 和 链接 局 负 责 将 程序 代码 和 函数 库 结 合 在 一 起 以 组 成 一 
个 单独 的 可 执行 文件 。 你 必须 使 用 -1 选项 指明 除 标准 C 语 言 运行 库 外 还 
需 使 用 的 库 。 

静态 库 ， 也 称 作 归档 文件 (archive) ， 按 惯例 它们 的 文件 名 都 
以 .a 结尾 。 比 如 ， 标 准 C 语 言 贸 数 库 /srlib/ibc.a 4H XII ES ZA 
J /usr/lib/libX11.a ° 

你 可 以 很 容易 地 创建 和 维护 自己 的 静态 库 ， 只 要 使 用 ar (代表 
archive， 即 建立 归档 文件 ) 程序 和 使 用 gcc -c 命 令 对 函数 分 别 进行 编 
译 。 你 应 该 尽 可 能 把 函数 分 别 保存 到 不 同 的 源 文件 中 。 如 果 男 数 需 要 
访问 公共 数据 ， 你 可 以 把 它们 放 在 同一 个 源 文件 中 ， 并 使 用 在 该 文件 


中 声明 的 静态 变量 。 
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在 本 例 中 ， 你 将 创建 一 个 小 型 画 数 库 ， 它 包含 两 个 画 数 ， 然 后 你 
将 在 一 个 示例 程序 中 调用 其 中 一 个 函数 。 这 两 个 函数 分 别 是 fred 和 
bi 让， 它们 只 打印 欢迎 信息 。 

(1) 首先 ， 为 两 个 函数 分 别 创建 各 自 的 源 文件 (将 它们 分 别 命名 
为 fred.c 和 bill.c) 。 下 面 是 第 一 个 源 文件 : 


#include <stdio 


— 4 ! €. c "mco ^ ^ zu 
printf("£red: we passed %d\n", arg); 


下 面 是 第 二 个 源 文件 : 


include <stdio.h> 


(2) 你 可 以 分 别 编译 这 些 函 数 以 产生 要 包含 在 库 文 件 中 的 目标 文 
件 。 这 可 以 通过 调用 带 有 -c 选 项 的 C 语 言 编 译 圳 来 完成 ，-c 选 项 的 作用 
是 阻止 编译 壤 创建 一 个 完整 的 程序 。 如 果 此 时 试图 创建 一 个 完整 的 程 
序 将 不 会 成 功 ， 因 为 你 还 未 定义 main 函 数 。 


$gcc -c bill.c fred.c 


Sls *.o 
bill.o fred.o 


(3) 现在 编写 一 个 调用 b 记 函数 的 程序 。 首 先 ， 为 你 的 库 文件 创 
建 一 个 头 文件 。 这 个 头 文件 将 声明 你 的 库 文 件 中 的 函数 ， 它 应 该 被 所 
有 希望 使 用 你 的 库 文件 的 应 用 程序 所 包含 。 把 这 个 头 文件 包含 在 源 文 
件 fred.c 和 bill.c 中 古 一 个 好 主意 ， 它 将 帮助 编译 右 发 现 所 有 错误 。 


; lib.h It declares the functions fred and bill fori 


hie 本 二 
"y 


void bill(char *); 


void fred(int); 


(4) 调用 程序 (program.c) 非常 简单 。 它 包含 库 的 头 文件 并 且 
调用 库 中 的 一 个 函数 。 
finclude <stdlib.h> 


finclude "lib.h" 


int main() 


(5) 现在 ， 你 可 以 编译 并 测试 这 个 程序 了 。 你 暂时 为 编译 絮 显 式 
指定 目标 文件 ， 然 后 要 求 编 译 器 编译 你 的 文件 并 将 其 与 先前 编译 好 的 
目标 模块 bill.o 链 接 。 


$gcc -c program.c 

$gcc -o program program.o bill.o 

$ ./program 

bill: we passed Hello World 

$ 

(6) 现在 ， 你 将 创建 并 使 用 一 个 库 文件 。 你 使 用 ar 程序 创建 一 个 

归档 文件 并 将 你 的 目标 文件 添加 进去 。 这 个 程序 之 所 以 称 为 ar， 是 因 
为 它 将 若干 单独 的 文件 归并 到 一 个 大 的 文件 中 以 创建 归档 文件 或 集 
合 。 注 意 ， 你 也 可 以 用 ar 程 序 来 创建 任何 类 型 文件 的 归档 文件 (与 许 
多 UNIX 工 具 一 样 ，ar 是 一 个 通用 工具 ) 。 

Sar crv libfoo.a bill.o fred.o 


a - bill.o 


a - fred.o 


(7) 库 文 件 创建 好 了 ， 两 个 目标 文件 也 已 添加 进去 。 在 某 些 系 
统 ， 尤 其 是 从 Berkeley UNIX 衍 生 的 系统 中 ， 要 想 成 功 地 使 用 函数 库 ， 
你 还 需要 为 函数 库 生 成 一 个 内 容 表 。 你 可 以 通过 ranlib 命 令 来 完成 这 一 
工作 。 在 Linux 中 ， 当 你 使 用 的 是 GNU 的 软件 开发 工具 时 ， 这 一 步骤 
并 不 是 必需 的 (但 做 了 也 无 妨 ) ° 


$ranlib libfoo.a 
你 的 函数 库 现 在 可 以 使 用 了 。 你 可 以 在 编译 器 使 用 的 文件 列表 中 
添加 该 库 文 件 以 创建 你 的 程序 ， 如 下 所 示 : 


$ gcc -o program program.o libfoo.a 
$ ./program 
bill: we passed Hello World 
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所 以 你 必须 使 用 工 选项 来 告诉 编译 器 在 何 处 可 以 找到 它 ， 如 下 所 示 : 


$ gcc -o program program.o -L. -lfoo 


- 工 .选项 告诉 编译 器 在 当前 目录 C) "PEHXERAUE » -foot Gif 
编译 器 使 用 名 为 libfoo.a 的 落 数 库 (或 者 名 为 libfoo.so 的 共享 库 ， 如 果 
它 存在 的 话 ) 。 要 查看 哪些 范 数 被 包含 在 日 标 文 件 、 函 数 库 或 可 执行 
文件 里 ， 你 可 以 使 用 nm 命令 。 如 果 你 查看 program 和 libfoo.a， 你 束 会 
看 到 函数 库 libfoo.a 中 包含 fred 和 bi 两 个 函数 ， 而 program 里 只 包含 函数 
bill « HP RAEN, CRAG RAVE Eine SEHJENAA ^ BPA 
FRAC ee Be PAT KAEH, (EF ANSE PS EN 
库 包含 在 最 终 的 程序 中 。 

如 果 你 熟悉 Windows 软 件 开发 ， 就 会 发 现 两 者 之 间 有 许多 相似 之 
处 ， 如 表 1-2 所 示 。 


5. 共享 库 


静态 库 的 一 个 缺点 是 ， 当 你 同时 运行 许多 应 用 程序 并 且 它 们 都 使 
用 来 目 同一 个 钞 数 库 的 范 数 时 ， 内 存 中 束 会 有 同一 钞 数 的 多 份 副本 ， 
而 且 在 程序 文件 自身 中 也 有 多 份 同样 的 副本 。 这 将 消耗 大 量 宝贵 的 内 
存 和 磁盘 空间 。 

许多 支持 共享 库 的 UNIX 系 统 和 Linux 可 以 克服 上 壕 不 足 。 对 共享 
库 及 其 在 不 同系 统 上 实现 方式 的 详细 讨论 超出 了 本 书 的 范围 ， 所 以 我 
们 将 仅 讨 论 Linux 下 的 实现 。 

共享 库 的 保存 位 置 与 静态 库 是 一 样 的 ， 但 共享 库 有 不 同 的 文件 名 
后 缀 。 在 一 个 典型 的 Linux 系 统 中 ， 标 准 数学 库 的 共享 版 本 
x&/usr/lib/libm.so ° 

当 一 个 程序 使 用 共享 库 时 ， 它 的 链接 方式 是 这 样 的 : 程序 本 身 不 
再 包含 函数 代码 ， 而 是 引用 运行 时 可 访问 的 共享 代码 。 当 编译 好 的 程 
序 补 装载 到 内 存 中 执行 时 ， 范 数 引 用 被 解析 并 产生 对 共 侍 库 的 调用 ， 
如 果 有 必要 ， 共 享 库 才 被 加 载 到 内 存 中 。 

通过 这 种 方法 ， 系 统 可 以 只 保留 共享 库 的 一 份 副 本 供 许 多 应 用 程 
序 同 时 使 用 ， 并 且 在 磁 一 上 也 仅 保存 一 份 。 另 一 个 好 处 是 共享 库 的 更 
渐 可 以 独立 于 依赖 它 的 应 用 程序 。 人 例如， 文件 jibylibm.so 就 是 对 实际 


库 文 件 修订 版 本 Vliblibm.so.N， 其 中 N 代 表 主 版 本 号 ， 在 写作 本 书 时 
它 是 6) 的 符号 链接 。 当 Linux 局 动 应 用 程序 时 ， 它 会 考虑 应 用 程序 需 
ees DAB 1E ES RUZE AI 39 hig AS SUD LH FP H Be I BÉ AE 


下 面 例子 的 输出 取 自 SUSE 10.3 发 行 版 ， 如 果 你 使 用 的 不 是 这 
个 发 行 版 ， 输 出 可 能 略 有 不 同 。 


对 Linux 系 统 来 说 ， 负 责 装 载 共享 库 并 解析 客户 程序 函数 引用 的 程 
Pe (动态 装载 器 ) 是 ld.so， 也 可 能 是 ld-linux.so.2、1d-lsb.so.2 或 ld- 
1sb.So.3。 用 于 搜索 共享 库 的 额外 位 置 可 以 在 文件 /etcld.so.conf 中 配 
置 ， 如 果 修 改 了 这 个 文件 ， 你 需要 执行 命令 ldconfig 来 处 理 它 (例如 ， 
安装 了 X 视 窗 系 统 后 需要 添加 X11 共 享 库 ) © 

你 可 以 通过 运行 工具 ldd 来 查看 一 个 程序 需要 的 共享 库 。 例 如 ， 如 
果 你 在 自己 的 示例 程序 上 运行 ltd， 你 将 看 到 如 下 所 示 的 输出 结果 : 


5 ldd program 
inux-cate 


^4 uu 


在 本 例 中 ， 你 看 到 标准 C 语 言 函数 库 (lib) 是 共享 的 〈.so) 。 程 
序 需 要 的 主 版 本 号 是 6。 其 他 UNIX 系 统 在 访问 共享 库 时 也 会 有 类 似 的 
安排 ， 详 情 请 参考 你 的 系统 文档 。 

共享 库 在 许多 方面 类 似 于 Windows 中 使 用 的 动态 链接 库 。. so 库 对 
应 于 .DLL 文件 ， 它 们 都 是 在 程序 运行 时 加 载 ， 而 .a 库 类 似 于 .LIB 文 
件 ， 它 们 都 包含 在 可 执行 程序 中 。 


1.3 


绝 大 多 数 Linux 系 统 都 为 系统 编程 接口 和 标准 工具 提供 了 很 好 的 文 
档 。 这 古 因 为 ， 从 早期 的 UNIX 系 统 开 始 ， 程 序 员 就 被 救 励 为 他 们 的 应 
用 程序 提供 手册 页 。 这 些 手册 页 都 可 以 通过 电子 形式 获得 ， 有 了 时 也 会 
以 印刷 品 的 形式 提供 。 

man 命 令 可 用 来 访问 在 线 手册 页 。 这 些 手册 页 在 质量 和 细 市 上 干 
荆 万 别 。 有 些 可 能 只 是 让 读者 参考 其 他 更 详细 的 文档 ， 而 男 外 一 些 则 
给 出 了 一 个 工具 所 文 持 的 所 有 选项 和 命令 的 完整 列表 。 无 论 是 哪 种 情 
况 ， 手 册页 者 是 一 个 好 的 起 点 。 

GNU 软 件 和 其 他 一 些 目 由 软件 还 使 用 名 为 info 的 在 线 文档 系统 。 
你 可 以 通过 专用 程序 info 或 通过 emacs 编 辑 器 中 的 info 命 令 来 在 线 浏览 
全 部 的 文档 。info 系 统 的 优点 是 ， 你 可 以 通过 链接 和 交叉 引用 来 浏 饮 
文档 并 可 直接 跳 转 到 相关 的 章节 。 对 文档 作者 来 说 ，info 系 统 的 优点 
征 它 的 文件 可 以 由 排版 印刷 文档 使 用 的 同一 个 源 文 件 目 动 生成 。 


X 验 手册 页 和 info 
让 我 们 来 看 看 GNU C 语 言 编译 器 (gcc) 的 文档 。 
(1) 首先 查看 手册 页 。 


man gcc 


ese Gre 


”如 果 你 愿意 ， 你 可 以 阅读 编译 器 支持 的 各 个 选项 的 相关 信息 。 这 
c EE 但 它 只 是 GNU C (和 C++) 整个 文档 中 的 
一 小 部 分 。 

在 阅读 手册 页 时 ， 你 可 以 按 空格 键 读 下 一 页 ， 按 Enter 键 (或 
Return 键 ， 如 果 你 的 键盘 上 是 Return 键 的 话 ) 读 下 一 行 ， 按 q 键 退出 。 
(2) 为 了 获得 更 多 关于 GNU C 的 信息 ， 你 可 以 使 用 info 命 令 。 


你 将 看 到 一 个 很 长 的 选项 菜单 ， 你 可 以 通过 选择 其 中 的 选项 在 一 
个 完全 文本 化 的 文档 中 移动 。 且 单项 和 层次 化 的 页 面 布局 允许 你 浏 宽 
很 大 的 文档 。 如 采 印 在 纸 上 的 话 ，GNU C 的 文档 有 好 几 百 页 之 多 。 

当然 ，info 系 统 也 包含 它 目 己 的 一 个 info 形 式 的 帮助 页 。 如 采 按 下 
Ctrl+H 组 合 键 ， 你 将 看 到 一 些 帮助 信息 ， 其 中 包括 一 个 如 何 使 用 imfo 的 
指南 e SANSA UEM Et n] DLE RE t 
UNIX 系 统 


1.4 小结 


- 


在 本 章 中 ， 我 们 了 解 了 Linux 程 序 设 计 的 相关 内 容 及 Linux 与 商业 
版 本 UNIX 系 统 的 相同 之 处 。 我 们 介绍 了 UNIX 开 发 者 可 用 的 各 种 各 样 
的 编程 系统 。 我 们 还 通过 一 个 简单 的 各 子 和 函数 库 演 示 了 基本 的 C 语 
言 工具 ， 并 将 其 与 Windows 中 的 对 应 内 容 进行 了 比较 。 


第 2 章 ”shell 程 序 设计 


我 们 在 本 书 的 开始 刚刚 介绍 了 用 C 语 言 进行 Linux 程 序 设计 ， 现 
在 却 要 调转 方向 学 习 编 写 shell 程 序 ， 这 是 为 什么 ? 在 其 他 的 一 些 操作 
系统 中 ， 命 令 行 界面 只 是 对 图 形 化 界面 的 一 个 补充 。 但 对 于 Linux 而 
言 ， 却 并 非 如 此 。 作 为 Linux 有 灵感 来 源 的 UNIX 系 统 最 初 根 本 就 没有 
形 化 界面 ， 所 有 的 任务 都 是 通过 命令 行 来 完成 的 。 因 此 ，UNIX 的 命令 
行 系统 得 到 了 很 大 的 发 展 ， 并 且 成 为 一 个 功能 强大 的 系统 。Linux 系 统 
沿袭 了 这 一 特点 ， 许 多 强大 的 功能 都 可 以 从 shell 中 轻松 实现 。 因 为 
shell 对 Linux 是 如 此 的 重要 ， 并 且 对 自动 化 简单 的 任务 非常 有 用 ， 所 以 
我 们 认为 应 该 尽早 介绍 shell 程 序 设计 。 

在 本 章 中 ， 我 们 将 通过 一 些 交 互 性 (基于 屏幕 ) 的 例子 来 向 读者 
展示 编写 shell 程 序 时 要 用 到 的 语法 、 结 构 和 命令 。 这 些 内 容 将 成 为 对 
shell 主 要 特性 及 其 效果 的 一 个 很 有 用 的 概要 介绍 。 同 时 ， 我 们 也 顺便 
介绍 两 个 在 shell 中 经 常用 到 的 特别 有 用 的 命令 行 工 具 : grep 和 find。 在 
介绍 grep 时 ， 我 们 还 将 介绍 正则 表达 式 的 基础 知识 ， 它 在 Linux 的 工具 
和 程序 设计 语言 《如 Perl、Ruby 和 PHP) 中 都 有 应 用 。 在 本 章 的 最 
后 ， 你 将 学 习 如 何 编写 一 个 真正 的 脚本 程序 ， 本 书 的 后 续 章 节 里 将 用 
C 语 言 对 它 进行 重 写 和 扩充 。 本 章 将 介绍 以 下 内 容 : 
什么 是 shell 
基本 思路 
微妙 的 语法 : 变量、 条 件 判 断 和 程序 控制 


数 
命令 和 命令 的 执行 
here 文 档 
调试 
grep 命 令 和 正则 表达 式 


find 命 令 
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因此 ， 无 论 你 是 在 系统 管理 工作 中 正面 对 着 复 杂 的 shell 脚 本 ， 或 
征 想 实 现 自己 最 新 的 了 不 起 (但 其 实 是 非常 简单 ) 的 想法 ， 或 只 是 想 
加 快 完成 一 些 重复 性 的 任务 ， 本 章 对 你 都 很 适用 。 


à] 


7 shell 编 程 


使 用 shell 进 行程 序 设计 的 原因 之 一 是 ， 你 可 以 快速 、 简 单 地 完成 
编程 。 而 且 ， 即 使 是 最 基本 的 Linux 安 装 也 会 提供 一 个 shell。 因 此 ， 如 
果 你 有 一 个 简单 的 构想 ， 则 可 以 通过 它 来 检查 目 己 的 想法 是 否 可 
行 .shell 也 非常 适合 于 编写 一 些 执行 相对 简单 的 任务 的 小 工具 ， 因 为 它 
们 更 强调 的 是 易于 配置 、 易 于 维护 和 可 移植 性 ， 而 不 是 很 看 重 执行 的 
效率 。 你 还 可 以 使 用 shell 对 进程 控制 进行 组 织 ， 使 命令 按照 预定 顺序 
在 前 一 阶段 命令 成 功 完成 的 前 提 下 顺序 执行 。 

虽然 shell 表 面 上 和 Windows 的 命令 提示 符 相 似 ， 但 是 它 具 备 更 强 
大 的 功能 以 完成 相当 复杂 的 程序 。 你 不 仅 可 以 通过 它 执行 命令 、 调 用 
Linux 工 具 ， 还 可 以 自己 编写 程序 .shell 执 行 shell 程 序 ， 这 些 程序 通常 被 
称 为 脚本 ， 它 们 是 在 运行 时 解释 执行 的 。 这 使 得 调试 工作 比较 容易 进 
行 ， 因 为 你 可 以 逐 行 地 执行 指令 ， 而 且 节 省 了 重新 编译 的 时 间 。 然 
而 ， 这 也 使 得 shell 不 适合 用 来 完成 时 间 紧 迫 型 和 处 理 需 忙 太 型 的 任 
务 。 


2.1 
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现在 ， 我 们 来 关注 一 点 UNIX (当然 也 是 Linux) HZ 9 UNIXZE 
构 非 常 依赖 于 代码 的 高 度 可 重用 性 。 如 果 你 编写 了 一 个 小 巧 而 简单 的 
工具 ， 其 他 人 就 可 以 将 它 作 为 一 根 链 条 上 的 某 个 环节 来 构成 一 条 命 
令 。Linux 让 用 户 满意 的 原因 之 一 就 是 它 提 供 了 各 种 各 样 的 优秀 工具 。 
下 面 是 一 个 简单 的 例子 : 
$ ls -al | more 

这 个 命令 使 用 了 ls 和 more 工 具 并 通过 管道 实现 了 文件 列表 的 分 屏 
显示 。 每 个 工具 就 是 一 个 组 成 部 件 。 通 常 你 可 以 将 许多 小 巧 的 脚本 程 
序 组 合 起 来 以 创建 一 个 庞大 而 复杂 的 程序 。 

例如 ， 如 果 你 想 打 印 bash 使 用 手册 的 参考 副本 ， 可 以 使 用 如 下 命 


$ man bash | col -b | lpr 


此 外 ， 因 为 Linux 具 备 目 动 文件 类 型 处 理 功 能 ， 所 以 使 用 这 些 工具 
的 用 户 一 般 不 必 了 解 它 们 是 用 哪 种 语言 编写 的 。 如 果 想 要 这 些 工 具 运 
行 得 更 快 ， 常 见 的 做 法 是 首先 在 shell 中 实现 工具 的 原型 ， 一 旦 确定 值 
得 这 么 做 ， 然 后 再 用 C 或 C++、Perl、Python 或 者 其 他 执行 得 更 快速 的 
语言 来 重新 实现 它们 。 相 反 ， 如 采 在 shell 中 这 些 工 具 工 作 得 已 足够 
好 ， 束 不必 再 重新 实现 它们 。 

征 否 需要 重新 实现 脚本 程序 取决 于 你 是 否 需要 对 它 进行 优化 ， 和 是 
人 否 需要 将 程序 移植 到 其 他 系统 ， 是 否 需要 让 它 更 易于 修改 以 及 它 是 否 
偏离 了 其 最 初 的 设计 目的 (这 种 情况 经 常 发 生 ) 。 


如 果 你 对 shell 脚 本 充满 好 奇 ，Linux 系 统 中 已 经 装 有 许多 的 
shell 脚本 例子 ， 包 括 软 件 包 安装 程序 、.xinitrc 和 startx 文 件 以 
及 /etc/rc.d 目 录 中 用 于 启动 时 配置 系统 的 脚本 程序 。 


2.3 人 是 shell 


在 开始 讨论 如 何 使 用 shell 进 行程 序 设计 之 前 ， 我 们 先 来 回顾 一 下 
shell 的 作用 以 及 Linux 系 统 中 提供 的 各 种 shell 。 shell 是 一 个 作为 用 户 与 
Linux 系 统 间 接口 的 程序 ， 它 允许 用 户 回 操作 系统 输入 需要 执行 的 命 
令 。 这 点 与 Windows 的 命令 提示 符 类 似 ， 但 正如 先前 所 提 到 的 ，Linux 
shell 的 功能 更 强大 。 例 如 ， 我 们 可 以 使 用 < 和 > 对 输入 输出 进行 重 定 
回 ， 使 用 I 在 同时 执行 的 程序 之 间 实 现 数据 的 管道 传递 ， 使 用 $ (...) 
获取 子 进程 的 输出 。 在 Linux 中 安装 多 个 shell 是 完全 可 行 的 ， 用 户 可 以 
挑选 一 种 自己 喜欢 的 shell 来 使 用 。 图 2-1 显 示 了 shell (实际 上 是 两 种 
shell: bash 和 csh) 和 其 他 程序 环绕 在 Linux 内 核 的 四 周 e 


图 2-1 


由 于 Linux 有 是 高 度 模块 化 的 系统 ， 所 以 你 可 以 从 各 种 不 同 的 shell 中 
选择 一 种 来 使 用 ， 虽 然 它 们 中 的 大 多 数 都 是 从 最 初 鸭 Bourne shell 演变 


而 来 的 。 在 Linux 系 统 中 ， 总 是 作为 /bin/sh 安 装 的 标准 shell 是 GNU 工 具 
集中 的 bash (GNUBourne-Again Shell) 。 因 为 它 作 为 一 个 优秀 的 
shell ， 总 是 安装 在 Linux 系 统 上 ， 而 且 它 是 开源 的 并 且 可 以 被 移植 到 几 
乎 所 有 的 类 UNIX 系 统 上 ， 所 以 我 们 把 它 作为 将 要 使 用 的 shell。 在 本 章 
中 ， 我 们 将 使 用 bash 的 第 3 版 ， 并 且 在 大 多 数 情况 下 只 使 用 那些 所 有 
POSIX 兼 容 的 shell 都 具备 的 功能 。 我 们 假设 bash 被 安装 为 /bin/sh 并 且 它 
是 你 的 登录 所 使 用 的 默认 shell。 在 大 多 数 Linux 发 行 版 中 ， 默 认 的 shell 
程序 /bin/sh 实 际 上 是 对 程序 bin/bash 的 一 个 连接 。 
你 可 以 使 用 如 下 命令 来 查看 bash 的 版 本 号 : 


$ /bin/bash --version 
INU Das: version 3.2 


elease (1686-pc-linux-gnu 


05 Free Software Foundation, Inc. 


如 果 你 想 要 切换 到 另 一 个 shell (例如 ，bash 不 是 你 的 系统 中 
默认 的 shel) ， 你 只 需 直 接 执行 需要 的 shell 程 序 (例如 ， 
/bin/bash) 就 可 以 运行 新 的 shell 并 且 改 变 命 令 提示 符 了 。 如 果 你 
使 用 的 是 UNIX 系 统 并 且 bash 没 有 被 安装 ， 你 可 以 从 GNU Web 网 
站 www.gnu.org 上 人 免费 下 载 它 。 它 的 源 代码 具有 高 度 的 可 移植 
性 ， 它 在 你 的 UNIX 版 本 上 编译 成 功 几 乎 不 会 有 什么 问题 。 


当 你 创建 Linux 用 户 时 ， 你 可 以 设置 这 个 用 户 要 使 用 的 shell， 这 个 
工作 既 可 以 在 创建 用 户 时 完成 ， 也 可 以 在 创建 用 户 之 后 ， 通 过 修改 用 


尸 信息 来 完成 。 图 2-2 显 示 了 使 用 Fedora 选 择 用 户 shell 的 界面 。 


User Manager 


还 有 许多 免费 的 或 商业 的 shell 可 以 使 用 ， 表 2-1 对 常用 的 shell 做 了 
一 个 简单 的 总 结 。 


she 有 许多 机 人 


除了 C shell 和 人 少数 变 体 以 外 ， 所 有 这 些 shell 都 很 相似 ， 并 且 都 与 
X/Open 4. 2 和 POSIX1003. 2 规范 中 对 于 shell 的 规定 非常 一 致 。POSIX 
1003. 2 对 于 shell 的 规定 很 少 ， 但 在 X/Open 中 的 扩展 规定 则 提供 了 一 个 
更 加 友好 、 功 能 更 加 强大 的 shell。X/Open 通 常 是 一 个 提出 更 多 要 求 的 
规范 ， 但 遵循 它 的 系统 也 更 加 友好 。 
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才能 对 Linux 程 序 〈 不 仅仅 是 shell 程 序 ) 的 输入 输出 进行 重 定向 。 


读者 可 能 已 经 对 某 些 类 型 的 重 定 同 比较 熟悉 了， 例如: 
ls -1 > lsoutput.txt 


$ 
这 条 命令 把 ls 命令 的 输出 保存 到 文件 lsoutput.txt 中 。 

然而 ， 重 定向 所 包含 的 内 容 可 比 这 个 简单 的 例子 所 显示 的 要 多 得 
多 。 你 将 在 第 3 章 学 习 更 多 关于 标准 文件 描述 符 的 内 容 ， 现 在 你 只 需 知 
道 文 件 描述 符 0 代 表 一 个 程序 的 标准 输入 ， 文 件 描述 符 1 代 表 标 准 输 
出 ， 而 文件 描述 符 2 代 表 标 准 错误 和 输出。 你 可 以 单独 地 重 定 癌 其 中 任何 
一 个 。 事 实 上 ， 你 还 可 以 重 定向 其 他 文件 描述 符 ， 但 对 标准 文件 描述 
符 0、1、2 以 外 的 文件 摘 述 符 进 行 重 定向 的 情况 很 少见 。 

上 面 的 例子 通过 > 操作 符 把 标准 输出 重 定 癌 到 一 个 文件 。 在 默认 
情况 下 ， 如 果 该 文件 已 经 存在 ， 它 的 内 容 将 被 覆盖 。 如 果 你 想 改 变 默 
认 行 为 ， 你 可 以 使 用 命令 set-o noclobber (或 set-C) 命令 设置 noclobber 
选项 ， 从 而 阻止 重 定向 操作 对 一 个 已 有 文件 的 禾 盖 。 你 可 以 使 用 set +o 
noclobber 命 令 取消 该 选项 。 你 将 在 本 章 后 面 的 内 容 中 看 到 更 多 的 set 命 
令 选 项 。 

你 可 以 用 >> 操 作 符 将 输出 内 容 附 加 到 一 个 文件 中 。 例 如 : 

S ps >> lsoutput .txt 
这 条 命令 会 将 ps 命令 的 输出 附加 到 指定 文件 的 尾部 。 

如 有 果 想 对 标准 错误 输出 进行 重 定 同 ， 你 需要 把 想 要 重 定 向 的 文件 
描述 符 编 号 加 在 > 操作 符 的 表面。 因为 标准 错误 输出 的 文件 描述 符 编 
号 是 2， 所 以 使 用 2> 操 作 符 。 当 需要 丢弃 错误 信息 并 阻止 它 显示 在 屏 
幕 上 时 ， 这 个 方法 很 有 用 。 

假设 你 想 用 kill 命 令 在 一 个 脚本 程序 里 终止 一 个 进程 ， 那 么 总 是 存 
在 这 种 可 能 性 ， 即 在 kill 命 令 执行 之 前 ， 那 个 需要 终止 的 进程 就 已 经 结 
束 了 。 如 果 出 现 这 种 情况 ，kil 命 令 将 辐 标准 错误 输出 写 一 条 错误 信 
妃 ， 并 且 在 默认 情况 下 ， 这 条 信息 将 会 显示 在 屏幕 上 。 通 过 对 标准 输 
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何 内 容 了 。 
。 下 面 的 命令 将 把 标准 条 出 和 慰 准 错 误 输 出 分 别 重 定向 到 不 同 的 


$ kill -HUP 1234 >killout.txt 2»killerr.txt 


如 条 你 想 把 两 组 输出 都 重 定 癌 到 一 个 文件 中 ， 你 可 以 用 >& 操 作 符 
来 结合 两 个 输出 。 如 下 所 示 : 
$ kill -1 1234 >killouterr.txt 2>&1 

这 条 命令 将 把 标准 输出 和 标准 错误 输出 都 重 定 疝 到 同一 个 文件 
中 。 请 注意 操作 符 出 现 的 顺序 。 这 条 命令 的 含义 是 “将 标准 输出 重 定 问 
到 文件 killouterr.txt， 然 后 将 标准 错误 输出 重 定向 到 与 标准 输出 相同 的 
地 方 。” 如 采 有 顺序 有 误 ， 重 定 回 将 不 会 按照 你 预期 的 那样 执行 。 

因为 可 以 通过 返回 码 〈 我 们 将 在 本 章 的 后 面 对 其 进行 详细 介绍 ) 
来 了 解 kill 命 令 的 执行 结 末 ， 所 以 通 间 并 不 需要 保存 标准 输出 或 标准 错 
运输 出 的 内 容 。 你 可 以 用 Linux 的 通用 “回收 站 ”/devnull 来 有 效 地 丢弃 
所 有 的 输出 信息 ， 如 下 所 示 : 


S kill -1 1234 »/dev/null 2>&1 


RAXA EE [eo BERE HER, Yn] DET ERA © DUI: 
S$ more < killout.txt 


”很 明显 ， 在 Linux 下 这 样 做 意义 不 大 ， 因 为 Linux 的 more 命 令 可 以 
接受 文件 名 作为 参数 ， 这 与 Windows 命 令 行 中 对 应 的 命令 不 同 。 


2.43 ”管道 


你 可 以 用 管道 操作 符 | 来 连接 进程 。Linux 与 MS-DOS 不 同 ， 在 
Linux 下 通过 管道 连接 的 进程 可 以 同时 运行 ， 并 且 随 着 数据 流 在 它们 之 
间 的 传递 可 以 自动 地 进行 协调 。 举 一 个 简单 的 例子 ， 你 可 以 使 用 sort 命 
令 对 ps 命令 的 输出 进行 排序 。 
如果 不 使 用 管道 ， 你 就 必须 分 几 个 步骤 来 完成 这 个 任务 ， 如 下 所 
JN: 


$ ps > psout.txt 
$ sort psout.txt > pssort.out 


一 个 更 精巧 的 解决 方案 是 用 管道 来 连接 进程 ， 如 下 所 示 : 
5 ps | sort > pssort.out 


如 果 想 在 屏幕 上 分 页 显示 输出 结果 ， 你 可 以 再 连接 第 三 个 进程 
more， 将 它们 都 放 在 同一 个 命令 行 上 ， 如 下 所 示 : 


$ ps | sort | more 


允许 连接 的 进程 数 日 是 没有 限制 的 。 假 设 你 想 看 看 系统 中 运行 的 
所 有 进程 的 名 字 ， 但 不 包括 shell 本 身 ， 可 以 使 用 下 面 的 命令 : 
$ ps -xo comm | sort | uniq | grep -v sh | more 

这 个 命令 首先 按 字母 顺序 排序 ps 命令 的 输出 ， 再 用 unig 命 令 去 除 
名 字 相 同 的 进程 ， 然 后 用 grep -vsh 命 令 删 除名 为 sh 的 进程 ， 最 终 将 结 
果 分 页 显示 在 屏幕 上 。 

如 你 所 见 ， 与 使 用 一 系列 单独 的 命令 并 且 每 个 命令 都 市 有 目 己 的 
临时 文件 相 比 ， 这 是 一 个 更 精巧 的 解决 方案 。 但 这 里 有 一 点 需要 引起 
注意 : 如 果 你 有 一 系列 的 命令 需要 执行 ， 相 应 的 输出 文件 是 在 这 一 组 
命令 被 创建 的 同时 立刻 被 创建 或 写 入 的 ， 所 以 决 不 要 在 命令 流 中 重复 
使 用 相同 的 文件 名 。 如 果 你 尝试 执行 如 下 命令 : 


cat mydata.txt | sort | uniq > mydata.txt 


你 最 终 将 得 到 一 个 裤 文 件 ， 因 为 你 在 读 取 文 件 mydata.txt 之 前 束 已 经 履 
盖 了 这 个 文件 的 内 容 。 


2.5 为 程序 设计 语言 的 shell 


现在 你 已 了 解 了 一 些 基本 的 shell 操 作 ， 是 时 候 开 始 介 绍 一 些 真正 
的 shell 脚 本 程序 了 。 编写 shell 脚 本 程序 有 两 种 方式 。 你 可 以 输入 一 系 
列 命令 让 shell 交 互 地 执行 它们 ， 也 可 以 把 这 些 命令 保存 到 一 个 文件 
中 ， 然 后 将 该 文件 作为 一 个 程序 来 调用 。 


2.5.1 ”交互 式 程序 


在 命令 行 上 直接 输入 shell 脚 本 是 一 种 测试 短小 代码 段 的 简单 而 快 
捷 的 方式 。 如 果 你 正在 学 习 shell 脚 本 或 仅仅 是 为 了 进行 测试 ， 使 用 这 
种 方式 是 非常 有 用 的 。 

假设 你 想 要 从 大 量 C 语 言 源 文 件 中 查找 包含 字符 串 POSIX 的 文 
件 。 与 其 使 用 grep 命 令 在 每 个 文件 中 搜索 字符 串 ， 然 后 再 分 别 列 出 包 
含 该 字符 捉 的 文件 ， 不 如 用 下 面 的 交互 式 脚 本 来 执行 整个 操作 : 

> for file in * 

> do 

> if grep -l POSIX $file 

> then 

> more $file 

> fi 

» done 


This is a file with POSIX in it treat it well 


请 注意 ， 当 shell 期 符 进 一 步 的 输入 时 ， 正 第 的 $shell 提 示 符 将 改变 
为 > 提示 符 。 你 可 以 一 直 输 入 下 去 ， 由 shel 来 判断 何 时 输入 完毕 并 立刻 
执行 脚本 程序 。 

在 这 个 例子 中 ，grep 命 令 输出 它 找 到 的 包含 POSIX 字 符 串 的 文 
件 ， 然 后 more 命 令 将 文件 的 内 容 显 示 在 屏幕 上 上。 最后， 返回 shell 提 示 
符 。 还 要 注意 的 是 ， 你 用 shell 变 量 来 处 理 每 个 文件 ， 以 使 该 脚本 目 文 
档 化 。 你 也 可 以 将 变量 名 起 为 ji， 但 是 变量 名 各 e 更 容易 理解 。 

shell 还 提供 了 通配符 扩展 (通常 称 为 globbing) 。 你 一 定 已 注意 到 
可 以 用 通配符 ?来 匹配 一 个 字符 串 。 但 是 你 可 能 不 知道 可 以 用 通配符 ? 
来 匹配 单个 字符 ， 而 [set] 人 允许 匹配 方 括号 中 任何 一 个 单个 字符 ，[set] 
对 方 括号 中 的 内 容 取 反 ， 即 匹配 任何 没有 出 现在 给 出 的 字符 集中 的 字 


符 。 扩 展 的 花 括 号 {} (只 能 用 在 部 分 shell 中 ， 其 中 包括 bash) 允许 你 
将 任意 的 字符 串 组 放 在 一 个 集合 中 ， 以 供 shell 进 行 扩展 。 例 如 : 


S ls my {finger,toe}s 


这 个 命令 将 列 出 文件 my_fingers 和 my_toes， 它 使 用 shell 来 检查 当前 日 
录 下 的 每 个 文件 。 当 我 们 在 本 章 结尾 详细 介绍 grep 命 令 和 正则 表达 式 
的 强大 功能 时 ， 我 们 将 回 过 头 来 再 次 研究 匹配 模式 中 的 这 些 规 则 。 
有 经 验 的 Linux 用 户 可 能 会 用 一 种 更 有 效 的 方式 来 执行 这 个 简单 的 
操作 。 也 许 使 用 如 下 的 命令 ; 
$ more ‘grep -1L POSIX *' 
或 使 用 功能 相同 的 为 一 种 命令 形式 : 
$ more $(grep -1 POSIX *) 
此 外 ， 下 面 的 命令 将 输出 包含 POSIX 字 符 串 的 文件 名 : 
$ grep -1 POSIX * | more 
在 上 面 的 脚本 中 ， 你 看 到 shell 利 用 其 他 命令 (如 grep 和 more) 来 
完成 主要 的 工作 .shell 本 吴 只 是 允许 你 将 几 个 现 有 的 命令 结合 在 一 起 ， 
以 构成 一 个 新 的 功能 强大 的 命令 。 你 将 在 后 面 的 脚本 示例 中 看 到 通 配 
符 扩 展 的 多 次 应 用 ， 并 且 我 们 还 将 在 本 章 中 介绍 grep 命 令 和 正则 表达 
式 时 详细 讨论 整个 扩展 的 细节 。 
如 果 每 次 想 要 执行 一 系列 命令 时 ， 你 都 要 经 过 这 么 一 个 宛 长 的 输 
入 过 程 ， 将 非常 令 人 烦恼 。 你 需要 将 这 些 命令 保存 到 一 个 文件 中 ， 即 
我 们 常 说 的 shell 脚 本 ， 这 样 你 就 可 以 在 需要 的 时 候 随 时 执行 它们 了 。 


2.5.2 ”创建 脚本 


御 完 ， 你 必须 用 一 个 文本 编辑 器 来 创建 一 个 包含 命令 的 文件 ， 将 
其 命名 为 first， 它 的 内 容 如 下 所 示 : 


程序 中 的 注释 以 # 符 号 开始 ， 一 直 持 续 到 该 行 的 结束 。 按 照 惯 例 ， 
我 们 通常 把 # 放 在 第 一 列 。 在 作出 这 样 一 个 算 统 的 陈述 之 后 ， 请 注意 第 
一 行 #!/bin/sh， 它 是 一 种 特殊 形式 的 注释 ，#1 字符 告诉 系统 同一 行 上 
紧 跟 在 它 后 面 的 那个 参数 是 用 来 执行 本 文件 的 程序 。 在 这 个 例子 
中 ，/bin/sh 是 默认 的 shell 程 序 。 


请 广 意 注释 中 使 用 的 是 绝 对 路 径 。 考 虑 到 加 后 兼容 性 ， 这 个 
路 径 按 惯例 最 好 不 要 超过 32 个 字符 ， 因 为 一 些 老 版 本 的 UNIX 在 使 
用 # ! 时 只 能 使 用 这 个 限制 之 内 的 字符 数 ， 虽 然 Linux 通 常 不 存在 
这 样 的 限制 。 


因为 脚本 程序 本 质 上 被 看 作 是 shell 的 标准 输入 ， 所 以 它 可 以 包含 
任何 能 够 通过 你 的 PATH 环境 变量 引用 到 的 Linux 命 令 。 

exit 命 令 的 作用 是 确保 脚本 程序 能 够 返回 一 个 有 意义 的 退出 码 (在 
本 章 的 后 面 将 对 此 进行 详细 介绍 ) 。 当 程序 以 交互 方式 运行 时 ， 我 们 
很 少 需要 检查 它 的 退出 码 ， 但 如 果 你 打算 从 另 一 个 脚本 程序 里 调用 这 
个 脚本 程序 并 查看 它 是 否 执 行 成 功 ， 那 么 返回 一 个 适当 的 退出 码 就 很 
重要 了 。 即 使 你 从 来 也 没 打 算 允 许 你 的 脚本 程序 被 男 一 个 脚本 程序 调 
用 ， 你 也 应 该 在 退出 时 返回 一 个 合理 的 退出 码 。 请 相信 自己 的 脚本 程 
序 是 有 用 的 ， 它 总 有 一 天 会 作为 其 他 脚本 程序 的 一 部 分 而 被 重用 。 

在 shell 程 序 设计 里 ，0 表 示 成 功 。 因 为 这 个 脚本 程序 并 不 能 检查 到 
任何 错误 ， 所 以 它 总 是 返回 一 个 表示 成 功 的 退出 码 。 我 们 将 在 本 章 后 
面 详 细 介 绍 exit 命 令 时 ， 再 回 过 头 来 解释 用 0 表示 成 功 的 原因 。 

请 注意 ， 这 个 脚本 没有 使 用 任何 的 文件 扩展 名 或 后 级。 一 般 情 况 
下 ，Linux 和 UNIX 很 少 利 用 文件 扩展 名 来 决定 文件 的 类 型 。 你 可 以 为 
脚本 使 用 .sh 或 者 其 他 扩展 名 ， 但 shell 并 不 关心 这 一 点 。 大 多 数 预 安装 
的 脚本 程序 并 没有 使 用 任何 文件 扩展 名 ， 检 查 这 些 文件 是 否 是 脚本 程 
序 的 最 好 方法 是 使 用 file 命 令 ， 例 如 ，file first 或 file /bin/bash。 你 可 以 
使 用 任何 适用 于 你 的 工作 环境 或 适合 于 你 的 方式 。 


` 


2.5.3 设置 为 可 执行 


现在 你 已 经 有 了 目 己 的 脚本 文件 ， 运 行 它 有 两 种 方法 。 比 较 人 简单 
的 方法 十 调用 shel， 并 把 脚本 文件 名 当成 一 个 参数 ， 如 下 所 示 : 


$ /bin/sh first 

这 可 以 工作 ， 但 如 果 能 像 对 待 其 他 Linux 命 令 那样 ， 只 输入 脚本 程 
序 的 名 字 就 可 以 调用 它 就 更 好 了 。 你 可 以 使 用 chmod 命 令 来 改变 这 个 
文件 的 模式 ， 使 得 这 个 文件 可 以 被 所 有 用 户 执行 ， 如 下 所 示 : 

S chmod +x first 


当然 ， 这 并 不 是 使 用 chmod 命 令 将 一 个 文件 设置 为 可 执行 的 
m 请 用 man chmod 命 令 查 看 它 的 八进制 参数 和 其 他 选项 


然后 你 可 以 用 下 面 的 命令 来 执行 它 : 
S first 

你 可 能 会 看 到 一 条 错误 信息 告诉 你 未 找到 命令 。 这 种 情况 很 可 能 
发 生 ， 因 为 shell 环 境 变量 PATH 并 没有 被 设置 为 在 当前 目录 下 查找 要 执 
行 的 命令 。 要 解决 这 个 问题 ， 一 种 办 法 是 在 命令 行 上 直接 输入 命令 
PATH=$PATH:. 或 编辑 你 的 。bash_profile 文 件 ， 将 刚才 这 条 命令 添加 到 
文件 的 末尾 ， 然 后 退出 登录 后 再 重新 登录 进来 。 另 外 ， 你 也 可 以 在 保 
存 脚本 程序 的 目录 中 输入 命令 。/first， 该 命令 的 作用 是 把 脚本 程序 的 
完整 的 相对 路 径 告诉 shell 。 

用 ./ 来 指定 路 径 还 有 另 一 个 好 处 ， 它 能 够 保证 你 不 会 意外 执行 系统 
中 与 你 的 脚本 文件 同名 的 另 一 个 命令 。 


你 不 应 该 用 这 种 方法 来 修改 超级 用 户 (一 般 其 用 户 名 为 
root) 的 PATH 变量 。 这 是 一 个 安全 方面 的 漏洞 ， 因 为 以 root 用 户 
身份 登录 的 系统 管理 员 可 能 会 因此 误 调 用 了 某 个 标准 命令 的 伪装 
版 本 。 本 书 其 中 一 位 作者 就 曾经 这 样 做 过 一 次 ， 目 的 当然 是 为 了 
癌 系 统管 理 员 指 出 这 一 点 ! 即使 对 于 普通 用 户 ， 把 当前 目录 包括 
在 PATH 变 量 中 也 多 少 有 些 危 险 。 因 此 ， 如 果 你 非常 关心 系统 的 


安全 ， 最 好 的 办 法 是 养 成 在 执行 当前 目录 中 的 所 有 命令 时 ， 在 其 
前 面 都 加 上 一 个 ./ 的 好 习惯 。 


在 确信 你 的 脚本 程序 能 够 正确 执行 后 ， 你 可 以 把 它 从 当前 目录 移 
到 一 个 更 合适 的 地 方 去 。 如 果 这 个 命令 只 供 你 本 人 使 用 ， 你 可 以 在 目 
己 的 家 目录 中 创建 一 个 bin 目 录 ， 并 且 将 该 目录 添加 到 你 自己 的 PATH 
变量 中 。 如 果 你 想 让 其 他 人 也 能 够 执行 这 个 脚本 程序 ， 你 可 以 
将 /usr/local/bin 或 其 他 系统 目录 作为 添加 新 程序 的 适当 位 置 。 如 果 你 在 
系统 上 没有 root 权 限 ， 你 可 以 要 求 系统 管理 员 帮 你 复制 你 的 文件 ， 当 
然 你 首先 必须 让 他 们 相信 这 些 程序 的 价值 才 行 。 为 了 防止 其 他 用 户 修 
改 脚 本 程序 ， 哪 怕 只 是 意外 地 修改 ， 你 也 应 该 去 挥 脚本 程序 的 写 权 
限 。 系 统管 理 员 用 来 设置 文件 属 主 和 访问 权限 的 一 系列 命令 如 下 所 
ZN: 
# cp first /usr/local/bin 
# chown root /usr/local/bin/first 
# chgrp root /usr/local/bin/first 
# chmod 755 /usr/local/bin/first 
注意 ， 你 在 这 里 不 是 修改 访问 权限 标志 的 特定 部 分 ， 而 是 使 用 
chmod 命 令 的 绝对 格式 ， 因 为 你 清楚 地 知道 你 需要 的 访问 权限 。 
如 果 你 愿意 ， 还 可 以 使 用 chmod 命 令 相 对 长 一 些 但 可 能 合 义 更 明 
确 的 格式 ， 如 下 所 示 : 


# chmod u=rwx,go=rx /usr/local/bin/first 


更 多 chmod 命 令 的 详细 资料 请 参考 它 的 使 用 手册 。 


在 Linux 系 统 中 ， 如 果 你 拥有 包含 某 个 文件 的 目录 的 写 权 
限 ， 就 可 以 删除 这 个 文件 。 为 安全 起 见 ， 应 该 确保 只 有 超级 用 户 
才能 对 你 想 保证 文件 安全 的 目录 执行 写 操作 。 因 为 目录 只 是 另 一 
种 类 型 的 文件 ， 所 以 拥有 对 一 个 目录 文件 写 权 限 的 用 户 可 以 添加 
和 删除 目录 文件 中 的 名 称 。 


26 shell 的 语 ; 


现在 你 已 看 过 一 个 简单 的 shell 程 序 示例 ， 有 是 时 候 来 深入 研究 shell 
强大 的 程序 设计 能 力 了 .shell 是 一 种 很 容易 学 习 的 程序 设计 语言 ， 它 可 
以 在 把 各 个 小 程序 段 组 合 为 一 个 大 程序 之 前 就 能 很 容易 地 对 它们 分 别 
进行 交互 式 的 测试 。 你 还 可 以 用 bash shell 编 写 出 相当 庞大 的 结构 化 程 
序 。 在 接 下 来 的 几 节 里 ， 我 们 将 学 习 以 下 内 容 : 
变量 :字符 串 、 数 字 、 环 境 和 参数 
条 件 : shell 中 的 布尔 值 
程序 控制 : if > elif ` for » while ` until ^ case 
命令 列表 
函数 
shell ^] E fg 
获取 命令 的 执行 结 
here 文 档 


2.6.1 变量 


在 shell 里 ， 使 用 变量 之 前 通常 并 不 需要 事先 为 它们 做 出 声明 。 你 
只 是 通过 使 用 它们 《比如 当 你 给 它们 赋 初 始 值 时 ) 来 创建 它们 。 在 默 
认 情 况 下 ， 所 有 变量 都 被 看 作 字符 串 并 以 字符 串 来 存储 ， 即 使 它们 被 
赋值 为 数值 时 也 是 如 此 .shel 和 一 些 工 具 程序 会 在 需要 时 把 数值 型 字符 
串 转 换 为 对 应 的 数值 以 对 它们 进行 操作 。Linux 是 一 个 区 分 大 小 写 的 系 
和 因此 shell 认 为 变量 foo 与 Foo 是 不 同 的 ， 而 这 两 者 与 Foo 义 是 不 同 

在 shell 中 ， 你 可 以 通过 在 变量 名 前 加 一 个 $ 符 号 来 访问 它 的 内 容 。 
无 论 何 时 你 想 要 获取 变量 内 容 ， 你 都 必须 在 它 前 面 加 一 个 $ 字 符 。 当 你 
为 变量 赋值 时 ， 你 只 需要 使 用 变量 名 ， 该 变量 会 根据 需要 被 自动 创 
建 。 一 种 检查 变量 内 容 的 简单 方式 就 是 在 变量 名 前 加 一 个 $ 符 号 ， 再 用 
echo 命 令 将 它 的 内 容 输 出 到 终端 上 。 

在 命令 行 上 ， 你 可 以 通过 设置 和 检查 变量 salutation 的 不 同 值 来 实 
际 查 看 变量 的 使 用 : 


口 口 口 口 口 口 口 口 


$ salutation=Hello 

$ echo $salutation 
Hello 

$ salutation="Yes Dear" 
$ echo $salutation 

Yes Dear 

$ salutation=7+5 

$ echo $salutation 

745 


注意 ， 如 果 字 符 串 里 包含 空格 ， 就 必须 用 引号 把 它们 括 起 
来 。 此 外 ， 等 号 两 边 不 能 有 空格 。 


你 可 以 使 用 read 命 令 将 用 户 的 输入 赋值 给 一 个 变量 。 这 个 
要 一 个 参数 ， 即 准备 读 入 用 户 输 入 数据 的 变量 名 ， 然 后 它 会 等 
输入 数据 。 通 利 情 况 下 ， 在 用 户 按 下 回 车 键 时 ，read 命 令 结束 。 
终端 上 读 取 一 个 变量 时 ， 你 一 般 不 需要 使 用 引号 ， 如 下 所 示 : 

S read salutation 

Wie geht's? 

S echo $salutation 

Wie geht's? 


A 
HB 
fi 


= Ta 


今 
用 
当 


1. 使 用 引号 
在 继续 学 习 之 前 ， 你 先 需要 型 清 楚 shell 的 一 个 特点 : 引号 的 使 


一 般 情 况 下 ， 脚 本 文件 中 的 参数 以 空 晶 字符 分 隔 (例如 ， 一 个 空 
格 、 一 个 制 表 符 或 者 一 个 换行 符 ) 。 如 有 果 你 想 在 一 个 参数 中 包含 一 个 
或 多 个 空 日 字符 ， 你 束 必 须 给 参数 加 上 引号。 

像 $foo 这 样 的 变量 在 引号 中 的 行为 取决 于 你 所 使 用 的 引号 类 型 。 
如 有 果 你 把 一 个 $ 变 量 表达 式 放 在 双 引 号 中 ， 程 序 执行 到 这 一 行 时 整 会 把 
变量 蔡 换 为 它 的 值 ， 如 果 你 把 它 放 在 单 引号 中 ， 就 不 会 发 生 车 换 现 
象 。 你 还 可 以 通过 在 $ 字 符 前 面 加 上 一 个 \ 学 符 以 取消 它 的 特殊 合 义 。 


bi 
x 
b 
Ut 
m 
X 
> 
f 
i 


字符 串通 常 都 被 放 在 双 引 号 中 ， 以 防止 变 
时 又 允许 4 扩展 。 


Sc 验 变量 的 使 用 
这 个 例子 显示 了 引号 在 变量 输出 中 的 作用 : 


输出 结果 如 下 : 


$ ./variable 

Hi there 

Hi there 

$myvar 

$myvar 

Enter some text 
Hello World 


mJ 1 . Ex 
Smvvar now edauals He 
3Ityvar now equais ello 


实验 解析 

变量 myvar 在 创建 时 被 赋值 字符 串 Hi there。 你 用 echo 命 令 显 示 该 
变量 的 内 容 ， 同 时 显示 了 在 变量 名 前 加 一 个 $ 和 从 号 就 能 得 到 变量 的 内 
容 。 你 看 到 使 用 双 引 号 并 不 影响 变量 的 替换 ， 但 使 用 单 引号 和 反 冬 线 
RT o 你 还 使 用 read 命 令 从 用 户 那 里 读 入 一 个 字符 


World 


2. 环境 变量 


当 一 个 shell 脚 本 程序 开始 执行 时 ， 一 些 变量 会 根据 环境 设置 中 的 
值 进行 初始 化 。 这 些 变量 通常 用 大 写字 母 做 名 字 ， 以 便 把 它们 和 用 户 
在 脚本 程序 里 定义 的 变量 区 分 开 来 ， 后 者 按 惯例 都 用 小 写 子 母 做 名 
字 。 具 体 创建 的 变量 取决 于 你 的 个 人 配置 。 在 系统 的 使 用 手册 中 列 出 


了 许多 这 样 的 环境 变量 ， 表 2-2 列 出 了 其 中 一 些 主要 的 变量 。 
表 2-2 


如 果 想 通过 执行 env <command> 命 令 来 查看 程序 在 不 同 环境 
下 是 如 何 工 作 的 ， 请 查阅 env 命 令 的 使 用 手册 。 你 也 将 在 本 章 的 后 
面 看 到 如 何 使 用 export 命 令 在 子 shell 中 设置 环境 变量 。 
3. 参数 变量 


如 果 脚 本 程序 在 调用 时 带 有 参数 ， 一 些 人 额外 的 变量 束 会 被 创建 。 
s un Fee ee, DRBEZBTERSSUIKIATETE, RAMEN (EOL 


参数 变量 见 表 2-3。 


表 2-3 


‘ E aii HIG 2 j 


通过 下 面 的 例子 ， 你 可 以 很 容易 地 看 出 $8@ 和 $* 之 间 的 区 别 : 


IFS='' 
set foo bar bam 
echo "$Q" 


oo bar bam 
echo "$*" 
barbam 

unset IFS 
echo "$*" 


PEE, CE, RO 
LOO Dar Dam 


如 你 所 见 ， 双 引号 里 面 的 $@ 把 各 个 参数 扩展 为 彼此 分 开 的 域 ， 而 
不 受 IFS 值 的 影响 。 一 般 来 说 ， 如 果 你 想 访问 脚本 程序 的 参数 ， 使 用 
$@ 是 明智 的 选择 。 
除了 使 用 echo 命 令 查 看 变量 的 内 容 外 ， 你 还 可 以 使 用 ead 合 人 来 
读 取 它们 。 


实 验 使 用 参数 和 环境 变量 

下 面 的 脚本 程序 演示 了 一 些 简单 的 变量 操作 。 当 输入 脚本 程序 的 
内 容 并 把 它 保存 为 文件 try_var 后 ， 别 饼 了 用 chmod +x try_var 命 令 把 它 
设置 为 可 执行 。 


) 


O 


9) 


( 


Vr UY rh X rh X XR UY 


运行 这 个 脚本 程序 ， 你 将 得 到 如 下 所 示 的 输出 结 采 : 


./try var foo bar baz 


llc 
The program ./try var is now r 
The second parameter was bar 
he first parameter was foc 


Wars ptor lier wac fan ha  — 
parameter iist was [00 Dar Daz 


实验 解析 

这 个 脚本 程序 创建 变量 salutation 并 显示 它 的 内 容 ， 然 后 显示 各 种 
参数 变量 以 及 环境 变量 SHOME 都 已 存在 并 有 了 适当 的 值 。 

我 们 将 在 后 面 进一步 介绍 参数 奉 换 。 


2.6.2 ”条件 


所 有 程序 设计 语言 的 基础 是 对 条 件 进 行 测试 判断 ， 并 根据 测试 结 
果 采 取 不 同行 动 的 能 力 。 在 讨论 它 之 前 ， 我 们 先 来 看 看 在 shell 脚 本 程 
序 里 可 以 使 用 的 条 件 结构 ， 然 后 再 来 看 看 使 用 这 些 条 件 的 控制 结构 。 

一 个 shell 脚 本 能 够 对 任何 可 以 从 命令 行 上 调用 的 命令 的 退出 码 进 
行 测试 ， 其 中 也 包括 你 自己 编写 的 脚本 程序 。 这 也 就 是 为 什么 要 在 所 
AA E o 

test 或 [ 命 

在 实际 工作 中 ， 大 多 数 脚 本 程序 都 会 广泛 使 用 shell 的 布尔 判断 命 
令 [ 或 test。 在 一 些 系统 上 ， 这 两 个 命令 的 作用 是 一 样 的 ， 只 是 为 了 增 
强 可 读 性 ， 当 使 用 [命令 时 ， 我 们 还 使 用 符号 ] 来 结尾 。 把 [符号 当 作 一 
条 命令 多 少 有 点 奇怪 ， 但 它 在 代码 中 确实 会 使 命令 的 语法 看 起 来 更 简 
单 、 更 明确 、 更 像 其 他 的 程序 设计 语言 。 


在 一 些 老 版 本 的 UNIX shell 中 ， 这 些 命令 调用 的 是 一 个 外 部 
程序 ， 但 在 较 新 的 shell 版 本 中 ， 它 们 已 成 为 shell 的 内 置 命令 。 我 
们 将 在 本 章 后 面 介绍 各 种 命令 时 再 次 讨论 这 个 问题 。 


因为 test 命 令 在 shell 脚 本 程序 以 外 用 得 很 少 ， 所 以 那些 很 少 编 
写 shell 脚 本 的 Linux 用 户 往 往 会 将 自己 编写 的 简单 程序 命名 为 
test。 如 果 程 序 不 能 正常 工作 ， 很 可 能 是 因为 它 与 shell 中 的 test 命 
令 发 生 了 冲突 。 要 想 查 看 系统 中 是 否 有 一 个 指定 名 称 的 外 部 命 
令 ， 你 可 以 党 试 使 用 which test 这 样 的 命令 来 检查 执行 的 是 哪 一 个 
test 命 令 ， 或 者 使 用 ./test 这 种 执行 方式 以 确保 你 执行 的 是 当前 目录 
Det 。 如 有 疑问 ， 你 只 需 养 成 在 调用 脚本 的 前 面 加 上 ./ 的 
习惯 即 可 。 


我 们 以 一 个 最 简单 的 条 件 为 例 来 介绍 test 命 令 的 用 法 : 检查 一 个 文 
件 是 否 存 在 。 用 于 实现 这 一 操作 的 命令 是 test -f <filename>， 所 以 在 脚 
本 程序 里 ， 你 可 以 写 出 如 下 所 示 的 代码 : 


你 还 可 以 写成 下 面 这 样 : 


test 命 令 的 退出 码 (表明 条 件 是 否 被 满足 ) 决定 是 否 需 要 执行 后 面 
的 条 件 代码 。 


注意 ， 你 必须 在 [符号 和 被 检查 的 条 件 之 间 留 出 空格 。 要 记 住 
2 d et 而 test 命 令 之 后 总 是 尽 
AH r4? 

如 果 你 喜欢 把 then 和 if 放 在 同一 行 上 ， 就 必须 要 用 一 个 分 号 把 
test 语 句 和 then 分 隔 开 。 如 下 所 示 : 


if [ -f fred.c ]; then 
fi 


test 命 令 可 以 使 用 的 条 件 类 型 可 以 归 为 3 类 : EAE EB EE ^ SOREL 
BOR 文件 有 关 的 条 件 测试 ， 表 2-4、 表 2-5 和 表 2-6 描 述 了 这 3 种 条 件 类 


RRM 


读者 可 能 想 知 道 什么 是 set-group-id 和 set-user-id 《也 叫做 set- 
gid 和 set-uid) 位 。setruid 位 授予 了 程序 其 拥有 者 的 访问 权限 而 不 
是 其 使 用 者 的 访问 权限 ， 而 set-gid 位 授予 了 程序 其 所 在 组 的 访问 
权限 。 这 两 个 特殊 位 是 通过 chmod 命 令 的 选项 和 g 设 置 的 。set- 
gid 和 set-uid 标 志 对 shell 脚 本 程序 不 起 作用 ， 它 们 只 对 可 执行 的 二 
进 制 文件 有 用 。 


我 们 稍微 超前 了 一 些 ， 但 是 接 下 来 的 测试 /bin/bash 文 件 状态 的 例 
子 可 以 让 你 看 出 如 何 使 用 它们 


ERE RNR AT E FY BY e LP ETE ° 
ERA DUM T tete Br AAI, SCRE OCs EPOR EE 
它 的 使 用 手册 。 如 果 你 使 用 的 是 bash， 那 么 test 命 令 是 shell 的 内 置 命 
令 ， 使 用 help test 命 令 可 以 获得 test 命 令 更 详细 的 信息 。 我 们 将 在 本 章 
后 面 用 到 这 里 给 出 的 部 分 选项 。 

现在 你 已 学 习 了 “条 件 ”， 下面 你 将 看 到 使 用 它们 的 控制 结构 。 


2.6.3 结 
jj 有 一 组 控制 结构 它们 与 其 他 程序 设计 语言 中 的 控制 结构 很 
日 似 。 


在 下 面 的 各 小 节 中 ， 各 语句 的 语法 中 的 statements 表示 
when、while 或 until 测 试 条 件 满足 时 ， 将 要 执行 的 一 系列 命令 。 


1. ifi&&] 


HAIER AE: ESE Ra CHOU AAR ETT MIN, RGR 
测试 结 采 有 条 件 地 执行 一 组 语句 。 如 下 所 示 : 


if 
then 


else 


fi 


sx 验 使 用 if 语句 
if 语 句 的 一 个 常见 用 法 是 提 一 个 问题 ， 然 后 根据 回答 作出 决定 ， 
如 下 所 示 : 


这 将 给 出 如 下 所 示 的 输出 : 


yes 


这 个 脚 本 程序 用 [命令 对 变量 timeofday 的 内 容 进 行 测试 ， 测 试 结果 
由 f 命 令 判 断 ， 由 它 来 决定 执行 哪 部 分 代码 。 


请 注意 ， 你 用 额外 的 空白 符 来 缩 进 if 结 构 内 部 的 语句 。 这 只 
是 为 了 照顾 人 们 的 阅读 习惯 ，shell 会 忽略 这 些 多 余 的 空白 符 。 


2 ，elif 语 句 


遗憾 的 古 ， 上 面 这 个 非常 简单 的 脚本 程序 存在 几 个 问题 。 其 中 一 
个 问题 是， 它 会 把 所 有 不 是 yes 的 回答 都 看 做 是 no。 你 可 以 通过 使 用 
elif 结 构 来 避免 出 现 这 样 的 情况 ， 它 允许 你 在 if 结构 的 else 部 分 被 执行 时 


增加 第 二 个 检查 条 件 。 


Sc 验 用 elif 结 构 做 进一步 检查 

你 可 以 对 上 面 的 脚本 程序 做 些 修改 ， 让 它 在 用 户 输 入 yes 或 no 以 外 
的 其 他 任何 数据 时 报告 一 条 出 错 信息 。 这 是 通过 将 else 替 换 为 elif 并 且 
增加 另 一 个 测试 条 件 的 方法 来 完成 的 。 


实验 解析 

这 个 脚本 程序 与 上 一 个 例子 很 相似 ， 但 新 增 的 elif 命 令 会 在 第 一 个 
if 条 件 不 满足 的 情况 下 进一步 测试 变量 。 如 采 两 次 测试 的 结果 都 不 成 
功 ， 束 打印 一 条 出 错 信 息 并 以 1 为 退出 码 结束 脚本 程序 ， 调 用 者 可 以 在 
调用 程序 中 利用 这 个 退出 码 来 检查 脚本 程序 是 否 执行 成 功 。 


3. 一 个 与 变量 有 关 的 问题 

刚才 所 做 的 修改 弥补 了 一 个 非常 明显 的 缺陷 ， 但 这 个 脚本 程序 还 
潜藏 着 一 个 更 隐蔽 的 问题 。 运 行 这 个 新 的 脚本 程序 ， 但 是 这 次 不 回答 
问题 ， 而 是 直接 按 下 回 车 键 (或 是 某 些 键盘 上 的 Return 键 ) 。 你 将 看 
到 如 下 所 示 的 出 错 信 息 ; 
[: =: unary operator expected 


哪里 出 问题 了 呢 ? RL EES — ifia AF o TEX 22 et timeofday 
x LIONE OUS eee ae ee ae 
TJ 


lf [ 一 "ves" ] 
而 这 不 是 一 个 合法 的 条 件 。 为 了 避免 出 现 这 种 情况 ， 你 必须 给 变量 加 
LSS, wR Ba: 


if [ "Stimeofday" = "yes" ] 
这 样 ， 一 个 空 变量 提供 的 就 是 一 个 合法 的 测试 了 : 
lf [ Hou 一 "ves" ] 


新 脚本 程序 如 下 所 示 : 


"T s e 
H o 


如 果 你 想 让 echo 命 令 去 掉 每 一 行 后 面 的 换行 符 ， 可 移植 性 最 

好 的 办 法 是 使 用 printf 命 令 (请 见 本 章 后 面 的 printf 一 节 ) 而 不 是 

echo 命 令 。 有 的 shell 用 echo-e 命 令 来 完成 这 一 任务 ， 但 并 不 是 所 

有 的 系统 都 支持 该 命令 。 bash 使 用 echo.n 命 令 来 夫 除 换行 T^f. Bm 

ER aaa aia 运行 在 bash 上 ， 你 就 可 以 使 用 如 下 
语 : 


5 ^ 54+ Ae T -— - "1 tA " "^ n E " 
t morning? Please answer yes or no: 


请 注意 ， 你 需要 在 结束 引号 前 留 出 一 个 额外 的 空格 ， 这 使 得 
在 用 户 输入 啊 应 前 有 一 个 间 聊 ， 从 而 看 起 来 更 加 整洁 。 


4. for 语句 


我 们 可 以 用 tor 结构 来 符 环 处 理 一 组 值 ， 这 组 值 可 以 是 任意 字符 串 
的 集合 。 它 们 可 以 在 程序 里 被 列 出 ， 更 常见 的 做 法 是 使 用 shell 的 文件 
25 Ris o 

它 的 语法 很 简单 : 

for variable in values 

do 

statements 
done 


Sc 验 使 用 固定 字符 串 的 for 循 环 
循环 值 通 党 是 字符 串 ， 所 以 你 可 以 这 样 写 程序 : 


该 程序 的 输出 结果 如 下 所 示 : 
bar 


如 果 你 把 第 一 行 由 for foo in bar fud 43 修 改 为 for foo in “bar 
fud 43” 会 怎样 呢 ? 别 忘 了 ， 加 上 引号 就 等 于 告诉 shell 把 引号 之 间 
的 一 切 东西 都 看 作 是 一 个 字符 串 。 这 是 在 变量 里 保留 空格 的 一 种 


aD hy o 


实验 解析 

这 个 例子 创建 了 一 个 变量 fo00， 然 后 在 for 人 循环 里 每 次 给 它 赋 一 个 不 
同 的 值 。 因 为 shell 在 默认 情况 下 认为 所 有 变量 包含 的 都 是 字符 串 ， 所 
以 字符 串 43 在 使 用 中 与 字符 串 甸 4 是 一 样 合法 有 效 的 。 


x 验 使 用 通配符 扩展 的 for 循 环 

正如 我 们 前 面 所 提 到 的 ，for 循 环 经 常 与 shell 的 文件 名 扩展 一 起 使 
用 。。 这 意味 着 在 字符 串 的 值 中 使 用 一 个 通配符 ， 并 由 shell 在 程序 执 
行 时 填写 出 所 有 的 值 。 

你 已 经 在 最 早 的 first 例 子 中 见 过 这 种 做 法 了 。 该 脚本 程序 用 shell 扩 
展 把 * 扩 展 为 当前 目录 中 所 有 文件 的 名 字 ， 然 后 它们 依次 作为 for 循 环 
中 的 变量 $ile 使 用 。 

我 们 来 快速 地 看 看 另外 一 个 通配符 扩展 的 例子 。 假 设 你 想 打 印 当 
前 目录 中 所 有 以 字母 {开头 的 脚本 文件 ， 并 且 你 知道 自己 的 所 有 脚本 程 
序 都 以 .sh 结尾 ， 你 就 可 以 这 样 做 : 


实验 解析 

这 个 例子 演示 了 $ (command) 语法 的 用 法 ， 我 们 将 在 后 面 的 内 容 
中 对 它 做 更 详细 地 介绍 (参见 2. 6. 6 节 ) 。 简 单 地 说 ，for 命 令 的 参数 
表 来 自 括 在 $ O 中 的 命令 的 输出 结果 。 

shell HEE. sh 给 出 所 有 匹配 此 模式 的 文件 的 名 字 。 


请 记 住 ，shell 脚 本 程序 中 所 有 的 变量 扩展 都 是 在 脚本 程序 被 
执行 时 而 不 是 在 编写 它 时 完成 的 。 所 以 ， 变 量 声明 中 的 语法 错误 
人 


5. whlie fj 


因为 在 默认 情况 下 ， 所 有 的 shel 变 量 值 都 被 认为 是 字符 串 ， 所 以 
for 循 环 特别 适合 于 对 一 系列 字符 串 进 行 循环 处 理 ， 但 如 果 你 事先 并 不 
知道 循环 要 执行 的 次 数 ， 那 么 它 就 显得 不 是 那么 有 用 了 。 

如 果 需 要 重复 执行 一 个 命令 序列 ， 但 事先 又 不 知道 这 个 命令 序列 
应 该 执行 的 次 数 ， 你 通常 会 使 用 一 个 while 循 环 ， 它 的 语法 如 下 所 示 ; 


while condition do 
statements 
done 
WAE PEGI, :uE— T ES TY AAE ET: 


这 个 脚本 程序 的 一 个 输出 示例 如 下 所 示 : 


Enter password 
password 
Sorry, try again 


secret 


a 
C. 
" 


很 明显 ， 这 不 是 一 种 询问 密码 的 非常 安全 的 办 法 ， 但 它 确实 演示 
了 while 语 句 的 作用 。do 和 done 之 间 的 语句 将 反复 执行 ， 直 到 条 件 不 再 
为 真 。 在 这 个 例子 中 ， 你 检查 的 条 件 是 变量 trythis 的 值 是 否 等 于 
secret ° 循环 将 一 直 执 行 直 到 Strythis 等 于 secret。 随 后 你 将 继续 执行 脚 
本 程序 中 紧 跟 在 done 后 面 的 语句 。 


6. untili&&] 
until 语 句 的 语法 如 下 所 示 : 


until condition 
do 
statements 
done 
它 与 while 循 环 很 相似 ， 只 是 把 条 件 测 试 反 过 来 了 。 换 句 话 说 ， 循 
环 将 反复 执行 直到 条 件 为 真 ， 而 不 是 在 条 件 为 真 时 反复 执行 。 


一 般 来 说 ， 如 果 需 要 循环 至 少 执行 一 次 ， 那 么 就 使 用 while 循 

YN 如 果 可 能 根本 都 不 需要 执行 循环 ， 就 使 用 until 循 环 。 
下 面 是 一 个 until 循 环 的 例子 ， 你 设置 一 个 警报 ， 当 某 个 特定 的 用 
户 登 录 时 ， 该 警报 就 会 启动 ， 你 通过 命令 行将 用 户 名 传递 给 脚本 程 


如 采用 户 已 经 登录 ， 那 么 循环 束 不 需要 执行 。 所 以 在 这 种 情况 
下 ， 使 用 until 语 句 比 使 用 while 语 句 更 目 然 。 


7.case 语 句 


case 结 构 比 你 目前 为 止 见 过 的 其 他 结构 都 要 稍微 复杂 一 些 。 它 的 
语法 如 下 所 示 : 
case variable in 
pattern [ | pattern] ...) statements;; 


pattern | | pattern] ...) statements;; 


这 看 上 去 有 些 令 人 生 旦 ， 但 case 结 构 允 许 你 通过 一 种 比较 复杂 的 
方式 将 变量 的 内 容 和 模式 进行 匹配 ， 然 后 再 根据 匹配 的 模式 去 执行 不 
同 的 代码 。 这 要 比 使 用 多 条 if、elif 和 else 语 句 来 执行 多 个 条 件 检 查 要 简 


单 得 多 。 


请 注意 ， 每 个 模式 行 都 以 双 分 号 G) 结尾 。 因 为 你 可 以 在 
前 后 模式 之 间 放 置 多 条 语句 ， 所 以 需要 使 用 一 个 双 分 号 来 标记 前 
一 个 语句 的 结束 和 后 一 个 模式 的 开始 。 


因为 case 结 构 具 备 匹 配 多 个 模式 然后 执行 多 条 相关 语句 的 能 力 ， 
这 使 得 它 非 常 适合 于 处 理 用 户 的 输入 。 弄 明 昌 case 工 作 原理 的 最 好 方 
法 束 古 通过 例子 来 进行 说 明 。 我 们 将 使 用 3 个 实验 例子 逐步 深入 地 对 它 
进行 介绍 ， 每 次 都 对 模式 匹配 进行 改进 。 


你 在 case 结 构 的 模式 中 使 用 如 * 这 样 的 通配符 时 要 小 心 。 因 为 
A 即使 后 续 的 模式 有 更 加 精确 的 匹 
是 如 此 。 


X É ” case 示例 一 : APRA 
你 可 以 用 case 结 构 编 写 一 个 新 版 的 输入 测试 脚本 程序 ， 让 它 更 具 
选择 性 并 且 对 非 预期 输入 也 更 宽容 : 


实验 解析 

当 case 语 名 被 执行 时 ， 它 会 把 变量 timeofday 的 内 容 与 各 字符 串 依 
次 进行 比较 。 一 旦 某 个 字符 串 与 输入 匹配 成 功 ，case 命 令 束 会 执行 紧 
随 右 括号 ) 后 面 的 代码 ， 然 后 就 结束 。 

case 命 令 会 对 用 来 做 比较 的 字符 串 进 行 正 常 的 通配符 扩展 ， 因 此 
你 可 以 指定 字符 串 的 一 部 分 并 在 其 后 加 上 一 个 * 通 配 符 。 只 使 用 一 个 单 
独 的 * 表 示 匹 配 任何 可 能 的 字符 串 ， 所 以 我 们 总 是 在 其 他 匹配 字符 串 之 
后 再 加 上 一 个 * 以 确保 如 果 没 有 字符 串 得 到 匹配 ，case 语 句 也 会 执行 某 
个 默认 动作 。 之 所 以 能 够 这 样 做 是 因为 case 语 句 是 按 顺 序 比较 每 一 个 
字符 串 ， 它 不 会 去 查找 最 佳 匹 配 ， 而 仅仅 是 查找 第 一 个 匹配 。 因 为 默 
认 条 件 通常 都 是 些 “ 最 不 可 能 出 现 ” 的 条 件 ， 所 以 使 用 * 对 脚本 程序 的 调 
试 很 有 帮助。 


x 验 case 示 例 二 : 合并 匹配 模式 
上 面 例子 中 的 case 结 构 明 显 比 多 个 让 语句 的 版 本 更 精致 ， 但 通过 合 
并 匹配 模式 ， 你 可 以 编写 一 个 更 加 清晰 的 版 本 。 如 下 所 示 : 


实验 解析 

这 个 脚本 程序 在 每 个 case 条 目 中 都 使 用 了 多 个 字符 串 ，case 将 对 每 
个 条 目 中 的 多 个 不 同 的 字符 串 进 行 测试 ， 以 诀 定 是 否 需 要 执行 相应 的 
语句 。 这 使 得 脚本 程序 不 仅 长 度 变 短 ， 而 且 实际 上 也 更 容易 阅读 。 这 
个 脚本 程序 同时 还 显示 了 * 通 配 符 的 用 法 ， 虽 然 这 样 做 有 可 能 匹配 意料 
之 外 的 模式 。 例 如 ， 如 果 用 户 输入 never， 它 束 会 匹配 n* 并 显示 出 Good 


Afternoon， 而 这 并 不 是 我 们 希望 的 行为 。 另 外 需要 注意 的 是 * 通 配 符 
扩展 在 引号 中 不 起 作用 。 


X 验 case 示 例 三 : 执行 多 条 语句 
最 后 ， 为 了 让 这 个 脚本 程序 具备 可 重用 性 ， 你 需要 在 使 用 默认 模 
式 时 给 出 另外 一 个 退出 码 。 如 下 所 示 : 


实验 解析 
为 了 演示 模式 匹配 的 不 同 用 法 ， 这 个 代码 改变 了 no 情况 下 的 匹配 
方法 。 你 还 看 到 了 如 何在 case 语 句 中 为 每 个 模式 执行 多 条 语句 。 注 
意 ， 你 必须 很 小 心地 把 最 精确 的 匹配 放 在 最 开始 ， 而 把 最 一 般 化 的 匹 
配 放 在 最 后 。 这 样 做 很 重要 ， 因 为 case 将 执行 它 找到 的 第 一 个 匹配 而 
不 是 最 佳 匹配 。 如 果 你 把 *) 放 在 开头 ， 那 不 管用 户 输入 的 是 什么 ， 都 
会 匹配 这 个 模式 。 
请 注意 ，esac 前 面 的 双 分 号 (;;) 是 可 选 的 。 在 C 语 言 程序 设 
计 中 ， 即 使 少 一 个 break 语 句 部 算是 不 好 的 程序 设计 做 法 ， 但 在 
shell 程 序 设 计 中 ， 如 果 最 后 一 个 case 模 式 是 默认 模式 ， 那 么 省 略 
最 后 一 个 双 分 号 (;;) 是 没有 问题 的 ， 因 为 后 面 没有 其 他 的 case 模 
式 需 要 考虑 了 。 


为 了 让 case 的 匹配 功能 更 强大 ， 你 可 以 使 用 如 下 的 模式 : 
[vY] | [Yvl[Ee][Ss] ) 


这 限制 了 人 允许 出 现 的 字母 ， 但 它 同时 也 人 允许 多 种 多 样 的 答案 并 且 
提供 了 比 * 通 配 符 更 多 的 控制 。 


8. 命令 列表 


有 时 ， 你 想 要 将 几 条 命令 连接 成 一 个 序列 。 例 如 ， 你 可 能 想 在 执 
行 某 个 语句 之 前 同时 满足 好 几 个 不 同 的 条 件 ， 如 下 所 示 : 


| i I; then 
t_file her 
t the other file hen 
echo *All files present, and correct" 


m 或 者 你 可 能 希望 至 少 在 这 一 系列 条 件 中 有 一 个 为 真 ， 像 下 面 这 


虽然 这 可 以 通过 使 用 多 个 if 语 句 来 实现 ， 但 如 你 所 见 ， 写 出 来 的 
程序 非常 条 拙 .shell 提 供 了 一 对 特殊 的 结构 ， 专 门 用 于 处 理 命 令 列表 ， 
它们 是 AND 列 表 和 OR 列表 。 虽 然 它 们 通常 在 一 起 使 用 ， 但 我 们 将 分 
别 介绍 它们 的 语法 。 

。AND 列 表 

AND 列 表 结 构 人 允许 你 按照 这 样 的 方式 执行 一 系列 命令 : 只 有 在 前 
面 所 有 的 命令 都 执行 成 功 的 情况 下 才 执 行 后 一 条 命令 。 它 的 语法 是 : 
Statementl && statement2 && statement3 && ... 

AZETFRRWRREDUI BEER RE m. WRK REN tue, EA 
边 的 下 一 条 命令 才能 够 执行 。 如 此 持续 直到 有 一 条 命令 返回 false， 或 
ee eM E 

每 条 语句 都 是 独立 执行 ， 这 就 允许 你 把 许多 不 同 的 命令 混合 在 一 
个 单独 的 命令 列表 中 ， 惑 像 下 面 的 脚本 程序 显示 的 那样 。AND 列 表 作 
为 一 个 整体 ， 只 有 在 列表 中 的 所 有 命令 都 执行 成 功 时 ， 才 算 它 执行 成 
D, CWR ERM ° 


X ANDI 


在 下 面 的 脚本 程序 中 ， 你 执行 touch file ones S (检查 文件 是 否 
存在 ， 如 果 不 存在 就 创建 并 删除 包 e_two 文 件 。 然 后 用 AND 列 表 检 碍 每 
个 文件 是 否 存在 并 通过 echo 命 令 给 出 相应 的 指示 。 


执行 这 个 脚本 程序 ， 你 将 看 到 如 下 所 示 的 结果 : 


实验 解析 

touch 和 rm 命令 确保 当前 目录 中 的 有 关 文 件 处 于 已 知 状态 。 然 后 
&& 列 表 执 行 [-ffile_one] 语 句 ， 这 条 语句 肯定 会 执行 成 功 ， 因 为 你 已 经 
确保 该 文件 是 存在 的 了 。 因 为 前 一 条 命令 执行 成 功 ， 所 以 echo 命 令 得 
以 执行 ， 它 也 执行 成 功 〈echo 命 令 总 是 返回 true) 。 当 执行 第 三 个 测试 
[-f file_two] 时 ， 因 为 该 文件 并 不 存在 ， 所 以 它 执 行 失 败 了 。 这 条 命令 
的 失败 导致 最 后 一 条 echo 语 句 未 被 执行 。 而 因为 该 命令 列表 中 的 一 条 
命令 失败 了 ， 所 以 && 列 表 的 总 的 执行 结果 是 false, if 语 句 将 执行 它 的 


else 部 分 。 


。OR 列 表 
OR 列 表 结 构 允 许 我 们 持续 执行 一 系列 命令 直到 有 一 条 命令 成 功 为 
止 ， 其 后 的 命令 将 不 再 被 执行 。 它 的 语法 是 : 


statement 


SN ERU P Y dm dr mace d.t 
i | | Statementd | | statement | | "EM 


从 左 开 始 顺 序 执行 每 条 命令 。 如 采 一 条 命令 返回 的 是 false， 它 右 
边 的 下 一 条 命令 才能 够 和 被 执行 。 如 此 持续 直到 有 一 条 命令 返回 true， 
或 者 列表 中 的 所 有 命令 都 执行 完毕 。 

| 列表 和 && 列 表 很 相似 ， 只 是 继续 执行 下 一 条 语句 的 条 件 现 在 变 
为 其 前 一 条 语句 必须 执行 失败 。 


实 验 OR 列表 
沿用 上 一 个 例子 ， 但 要 修改 下 面 程序 清单 里 阴影 部 分 的 语句 : 


“这 个 脚本 程序 的 输出 是 


实验 解析 

头 两 行 代 码 简 单 的 为 脚本 程序 的 剩余 部 分 设置 好 相应 的 文件 。 第 
一 条 命令 [-f fle_one] 失 败 了 ， 因 为 这 个 文件 不 存在 。 接 下 来 执行 echo 
语句 ， 它 返回 true， 因 此 || 列 表 中 的 后 续 命 令 将 不 会 被 执行 ， 因 为 HI 列 
ee ene 
其 then 部 分 。 

这 两 种 结构 的 返回 结果 都 等 于 最 后 一 条 执行 语句 的 返回 结果 © 

这 些 列 表 类 型 结构 的 执行 方式 与 C 语 言 中 对 多 个 条 件 进 行 测试 的 
执行 方式 很 相似 。 只 需 执 行 最 少 的 语句 就 可 以 确定 其 返回 结果 。 不 影 
啊 返 回 结 果 的 语句 不 会 被 执行 。 这 通常 被 称 为 短路 径 求 值 
(shortcircuit evaluation) 。 


将 这 两 种 结构 结合 在 一 起 将 更 能 体现 逻辑 的 魅力 。 请 看 : 


[ -f file one ] && command for true || command for false 

在 上 面 的 语 名 中， 如果 测 试 成 功 就 会 执行 第 一 条 命令 ， 否 则 执行 
第 二 条 命令 。 你 最 好 用 这 些 不 寻常 的 命令 列表 来 进行 实验 ， 但 在 通常 
情况 下 ， 你 应 该 用 括号 来 强制 求 值 的 顺序 。 


9. BAR 
如 果 你 想 在 某 些 只 人 允许 使 用 单个 语句 的 地 方 (比如 在 AND 或 OR 


列表 中 ) 使 用 多 条 语句 ， 你 可 以 把 它们 括 在 人 花 括号 全 中 来 构造 一 个 语 
a ree ek ene oe 


2.6.4 ERI 


你 可 以 在 shell 中 定义 函数 。 如 采 你 想 编 写 大 型 的 shell 脚 本 程序 ， 
你 会 想到 用 它们 来 构造 目 己 的 代码 。 


作为 另 一 种 选择 ， 你 可 以 把 一 个 大 型 的 脚本 程序 分 成 许多 小 
一 点 的 脚本 程序 ， 让 每 个 脚本 完成 一 个 小 任务 。 但 这 种 做 法 有 几 
个 缺点 : 在 一 个 脚本 程序 中 执行 另外 一 个 脚本 程序 要 比 执行 一 个 
函数 慢 得 多 ; 返回 执行 结 采 变 得 更 加 困难 ， 而 且 可 能 存在 非 肖 多 
的 小 脚本 。 你 应 该 考虑 目 己 的 脚本 程序 中 是 否 有 可 以 明显 的 单独 
存在 的 最 小 部 分 ， 并 将 其 作为 是 否 应 将 一 个 大 型 脚本 程序 分 解 为 
一 组 小 脚本 的 衡量 尺度 。 


要 定义 一 个 shell 函 数 ， 你 只 需 写 出 它 的 名 字 ， 然 后 是 一 对 空 丘 
， 再 把 男 数 中 的 语句 放 在 一 对 伦 括 号 中 ， 如 下 所 不 : 


Jl 


验 ”一 个 简单 的 函数 
dil A — P 3E SR 6] DJ ER BOT 38: 


X 


foc ( 


trix NDA RUT 2 t asi (lr B. 


”运行 这 个 脚本 程序 会 显示 如 下 的 输出 信息 : 


实验 解析 

这 个 脚本 程序 还 是 从 目 己 的 顶部 开始 执行 ， 这 一 点 与 其 他 脚本 程 
序 没什么 分 别 。 但 当 它 遇见 foo () { 结 构 时 ， 它 知道 脚本 正在 定义 一 
个 名 为 foo 的 函数 。 它 会 记 住 foo 代 表 着 一 个 函数 并 从 } 子 符 之 后 的 位 置 
继续 执行 。 当 执行 到 单独 的 行 foo 时 ，shel 就 知道 应 该 去 执行 刚才 定义 


PERE T° Sak SRT SCL, DUT ik Bl Vel H foo Ea Zt 
的 那 条 语句 的 后 面 继续 执行 。 

你 必须 在 调用 一 个 函数 之 前 先 对 它 进行 定义 ， 这 有 点 像 Pascal 语 
富里 钞 数 必须 先 于 调用 而 被 定义 的 概念 ， 只 是 在 shell 中 不 存在 前 问 声 
明 。 但 这 并 不 会 成 为 什么 问题 ， 因 为 所 有 脚本 程序 都 是 从 顶部 开始 执 
行 ， 所 以 只 要 把 所 有 辑 数 定义 都 %% 放 在 任何 一 个 函数 调用 之 前 ， 就 可 
以 保证 所 有 的 函数 在 被 调用 之 前 束 悦 定义 了 。 

当 一 个 函数 被 调用 时 ， 脚 本 程序 的 位 置 参 数 ($* > $@ > SHS 
$1、$2 等 ) 会 被 替换 为 函数 的 参数 。 这 也 是 你 读 取 传 递 给 函数 的 参 净 
的 办 法 。 当 画 数 执行 完毕 后 ， 这 些 参数 会 恢复 为 它们 先前 的 值 。 


一 些 老 版 本 的 shell 在 画 数 执行 之 后 可 能 不 会 恢复 位 置 参数 的 
人 自己 的 脚本 程序 具备 可 移植 性 ， 就 最 好 不 要 
M 一 行 站 o 


你 可 以 通过 return 命 令 让 函数 返回 数字 值 。 证 函数 返回 字符 串 值 的 
常用 方法 是 让 范 数 将 字符 绅 保 存在 一 个 变量 中 ， 该 变量 然后 可 以 在 画 
。 此 外 ， 你 还 可 以 echo 一 个 字符 串 并 捕获 其 结果 ， 

0 下 所 示 : 


ho JAY;) 


请 广 意 ， 你 可 以 使 用 local 关 键 字 在 shell 函 数 中 声明 局 部 变量 ， 局 
部 变量 将 仅 在 函数 的 作用 范 围 内 有 效 。 此 外 ， 男 数 可 以 访问 全 局 作用 
范围 内 的 其 他 shell 变 量 。 如 采 一 个 局 部 变量 和 一 个 全 局 变量 的 名 字 相 
同 ， 前 者 束 会 履 盖 后 者 ， 但 仅 限于 函数 的 作用 范围 之 内 。 例 如 ， 你 可 
以 对 上 面 的 脚本 程序 进行 如 下 的 修改 来 查看 执行 结果 : 


sample textz*global variable’ 


AIRE EN ACA f Hretun RAE — MEME, KAG [STR 
征 执 行 的 最 后 一 条 命令 的 退出 码 。 


Sc 验 从 函数 中 返回 一 个 值 

下 一 个 脚本 程序 my_name 演 示 了 函数 的 参数 是 如 何 传递 的 ， 以 及 
函数 如 何 返回 一 个 true 或 false 值 。 你 使 用 一 个 参数 来 调用 该 脚本 程序 ， 
该 参数 是 你 想 要 在 问题 中 使 用 的 名 字 。 
(1) 在 shell 头 之 后 ， 我 们 定义 了 函数 yes_or_no: 


recurs 


这 个 脚本 程序 的 典型 输出 如 下 所 示 : 


$ ./my name Rick Neil 

Original parameters are Rick Neil 
s your name Rick ? 

nter yes or no: yes 


1 Rick, nice name 


Ur Lut: 


实验 解析 

脚本 程序 开始 执行 时 ， 画 数 yes_or_no 被 定义 ， 但 移 不 会 执行 。 在 
让 语句 中 ， 脚 本 程序 执行 到 画 数 yes_or_ no 时 ， 先 把 $1 替 换 为 脚本 程序 
的 第 一 个 参数 Rick， 再 把 它 作为 参数 传递 给 这 个 函数 。 函 数 将 使 用 这 
些 参数 (它们 现在 被 保存 在 $1、$2 等 位 置 参 数 中 ) 并 向 调用 者 返回 一 
个 值 。if 结 构 再 根据 这 个 返回 值 去 执行 相应 的 语句 。 

如 你 所 见 ，shell 有 痢 丰 富 的 控制 结构 和 条 件 语句 。 接 下 来 ， 你 需 
要 学 习 一 些 shell 的 内 置 命 令 ， 然 后 你 忠 要 在 不 使 用 编译 融 的 情况 下 解 
决 一 个 实际 的 程序 设计 问题 了 ! 


265 ”命令 


你 可 以 在 shell 脚 本 程序 内 部 执行 两 类 命令 。 一 类 是 可 以 在 命令 提 
示 符 中 执行 的 “普通 ”命令 ， 也 称 为 外 部 命令 (external command) , — 
类 是 我 们 前 面 提 到 的 “内 置 > 命 令 ， 也 称 为 内 部 命令 (internal 
command) 。 内 置 命令 是 在 shell 内 部 实现 的 ， 它 们 不 能 作为 外 部 程序 
被 调用 。 然 而 ， 大 多 数 的 内 部 命令 同时 也 提供 了 独立 运行 的 程序 版 本 
这 一 需求 是 PZOSIX 规 范 的 一 部 分 。 通 第 情况 下 ， 命 令 是 内 部 的 还 
是 外 部 的 并 不 重要 ， 只 是 内 部 命令 的 执行 效率 更 高 。 

我 们 在 这 里 将 只 介绍 那些 在 编写 脚本 程序 时 会 用 到 的 主要 命令 ， 
不 分 内 部 还 是 外 部 。 作 为 一 个 Linux 用 户 ， 你 可 能 还 知道 许多 其 他 可 以 
在 命令 提示 符 下 执行 的 合法 命令 。 请 记 住 ， 除 了 我 们 在 这 里 介绍 的 内 
置 命 令 外 ， 它 们 同样 也 可 以 在 脚本 程序 中 使 用 。 

1. break 命 令 

你 可 以 用 这 个 命令 在 控制 条 件 未 满足 之 前 ， 跳 出 for、while 或 until 
循环 。 你 可 以 为 break 命 令 提 供 一 个 额外 的 数值 参数 来 表明 需要 跳出 的 
循环 层 数 ， 但 我 们 并 不 建议 读者 这 么 做 ， 因 为 它 将 大 大 降低 程序 的 可 
读 性 。 在 默认 情况 下 ，break 只 跳出 一 层 循 环 。 


但 它 的 输出 可 读 性 较 差 。 

你 可 能 会 看 到 将 它 用 作 while 循 环 的 条 件 ，while 实现 了 一 个 无 限 
循环 ， 代 替 了 更 常见 的 whiletrue. 

: 结构 也 会 被 用 在 变量 的 条 件 设置 中 ， 例 如 : 


S{var:=value} 
如 果 没 有 : ,shell 将 试图 把 圣 var 当 作 一 条 命令 来 处 理 。 


在 一 些 shell 脚 本 ， 主 要 是 一 些 旧 的 shell 脚 本 中 ， 你 可 能 会 看 
到 冒号 被 用 在 一 行 的 开头 来 表示 一 个 注释 。 但 现代 的 脚本 总 是 用 # 
来 开始 一 个 注释 行 ， 因 为 这 样 做 执行 效率 更 高 。 


3 ，continue 命 令 
非常 类 似 C 语 言 中 的 同名 语句 ， 这 个 命令 使 for、while 或 until 循 环 
跳 到 下 一 次 循环 继续 执行 ， 循 环 变量 取 循 环 列表 中 的 下 一 个 值 。 


continue HJ DA i —4 n6] 3A DL ez 8 EB RAT EA RE 
数 ， 也 就 是 说 你 可 以 部 分 地 跳出 藤 套 循环 。 这 个 参数 很 少 使 用 ， 因 为 
它 会 导致 脚本 程序 极 难 理解 。 例 如 : 


它 的 输出 是 : 
before 
before 
before 


4. . fp 
点 (.) 命令 用 于 在 当前 shell 中 执行 命令 : 


./shell script 


通常 ， 当 一 个 脚本 执行 一 条 外 部 命令 或 脚本 程序 时 ， 它 会 创建 一 
个 新 的 环境 (一 个 子 shell) ， 命 令 将 在 这 个 新 环境 中 执行 ， 在 命令 执 
行 完毕 后 ， 这 个 环境 被 丢弃 ， 留 下 退出 码 返回 给 父 shell。 但 外 部 的 
Source 命令 和 点 命令 〈 这 两 个 命令 差不多 是 同义词 ) 在 执行 脚本 程序 
中 列 出 的 命令 时 ， 使 用 的 是 调用 该 脚本 程序 的 同一 个 shell. 

因为 在 默认 情况 下 ，shell 脚 本 程序 会 在 一 个 新 创建 的 环境 中 执 
行 ， 所 以 脚本 程序 对 环境 变量 所 作 的 任何 修改 都 会 丢失 。 而 点 命令 允 
许 执 行 的 脚本 程序 改变 当前 环境 。 当 你 要 把 一 个 脚本 当 作 “ 包 右 器 ”来 
为 后 续 执 行 的 一 些 其 他 命令 设置 环境 时 ， 这 个 命令 通常 束 很 有 用 。 例 
如 ， 如 果 你 正 同时 参与 几 个 不 同 的 项 目 ， 你 束 可 能 会 遇 到 需要 使 用 不 
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ee SINN 比如 说 调用 一 个 老 版 本 的 编译 局 来 维护 
—^ IEEE ° 

在 shell 脚 本 程序 中 ， 点 命令 的 作用 有 点 类 似 于 C 或 C++ 语言 里 的 
#unclude 指 令 。 尽 管 它 并 没有 从 字面 意义 上 包含 脚本 ， 但 它 的 确 是 在 
uL ee 所 以 你 可 以 使 用 它 将 变量 和 函数 定义 结合 进 
上 F o 


X 验 点 () 命令 
下 面 的 例子 在 命令 行 中 使 用 点 命令 ， 但 你 完全 可 以 把 它 用 在 一 个 
脚本 程序 中 。 
(1) 假设 你 有 两 个 包含 环境 设置 的 文件 ， 它 们 分 别针 对 两 个 不 同 
的 开发 环境 。 为 了 设置 老 的 、 经 典 命令 的 环境 ， 你 可 以 使 用 文件 
classic_set， 它 的 内 容 如 下 所 示 : 


“(2) 对 于 新 命令 ， 使 用 文件 latest_set 


你 可 以 通过 将 这 些 脚 本 程序 和 点 命令 结合 来 设置 环境 ， 束 像 下 面 
的 示例 那样 : 


. «/classic_set 
echo $vers: 


‘> . /latest set 


echo $version 


实验 解析 

这 个 脚本 程序 使 用 点 命令 执行 ， 所 以 每 个 脚本 程序 都 是 在 当前 
shell 中 执行 。 这 使 得 脚本 程序 可 以 改变 当前 shell 中 的 环境 设置 ， 即 使 
脚本 程序 执行 结束 后 ， 这 些 改变 仍然 有 效 。 


5. echo 命 令 
虽然 ， X/Open 建议 在 现代 shel 冲 使 用 printf 命 令 ， 但 我 们 还 是 依照 
常规 使 用 echo 命 令 来 输出 结尾 禹 有 换行 符 的 字符 串 。 
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对 这 个 问题 有 着 不 同 的 解决 方法 。Linux 常 用 的 解决 方法 如 下 所 示 : 


echo -n "string to output" 
但 你 也 经 常会 遇 到 |: 
echo -e "string to output\c" 


第 二 种 方法 echo-e 确 保 启 用 了 反 斜 线 转 义 字符 《如 \c 代 表 去 掉 换 行 
符 ，X 代 表 制 表 符 ，m 代 表 回 车 ) 的 解释 。 在 老 版 本 的 bash 中 ， 对 反 和 斜 
线 园 义 子 符 的 解释 通常 都 是 默认 局 用 的 ， 但 最 新 版 本 的 bash 通 第 在 默 
认 情 况 下 都 不 对 反 斜 线 转 义 字 符 进行 解释 。 你 所 使 用 的 Linux 发 行 版 的 
详细 行为 请 查看 相关 于 册 。 


如 果 你 需要 一 种 删除 结尾 换行 符 的 可 移植 方法 ， 则 可 以 使 用 
外 部 命令 tr 来 删除 它 ， 但 它 执行 的 速度 比较 慢 。 如 果 你 需要 自己 
的 脚本 兼容 UNIX 系 统 并 且 需 要 删除 换行 符 ， 最 好 坚持 使 用 printf 
命令 。 如 果 你 的 脚本 只 需要 运行 在 Linux 和 bash 上 ， 那 么 echo-n 是 
不 错 的 选择 ， 虽 然 你 可 能 需要 在 脚本 的 开头 加 上 #1/bin/bash， 以 
明确 表示 你 需要 bash 格 的 行为 。 


6 ，eval 命 令 

eval 命 令 人 允许 你 对 参数 进行 求 值 。 它 是 shell 的 内 置 命 令 ， 通 常 不 
ae 。 我 们 借用 X/Open 规范 中 的 一 个 小 例子 来 演 
mE J 用 法 : 


Hi Y foo, m 
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eval 命 令 十 分 有 用 ， 它 允许 代码 被 随时 生成 和 运行 。 虽 然 它 的 确 
增加 了 脚本 调试 的 复杂 度 ， 但 它 可 以 让 你 完成 使 用 其 他 方法 难以 或 者 
根本 无 法 完成 的 事情 。 


75 exec 命 令 


exec 命 令 有 两 种 不 同 的 用 法 。 它 的 典型 用 法 是 将 当前 shell 蔡 换 为 
一 个 不 同 的 程序 。 例 如 : 
exec wall "Thanks for all the fish" 


脚本 中 的 这 个 命令 会 用 wall 命 令 蔡 换 当 前 的 shell。 脚 本 程序 中 exec 命 令 
后 面 的 代码 都 不 会 执行 ， 因 为 执行 这 个 脚本 的 shell 已 经 不 存在 了 。 
exec 的 第 二 种 用 法 是 修改 当前 文件 描述 符 : 


exec 3< afile 


ji FEET SBT AP 以 便 从 文件 afile 中 读 取 数据 。 这 种 用 法 
Té J^ Wl, o 

8. exit nf 

exit 命 令 使 脚本 程序 以 退出 码 n 结 束 运 行 。 如 果 你 在 任何 一 个 交互 
式 shell 的 命令 提示 符 中 使 用 这 个 命令 ， 它 会 使 你 退出 系统 。 如 果 你 允 
许 目 己 的 脚本 程序 在 退出 时 不 指定 一 个 退出 状态 ， 那 么 该 脚本 中 最 后 
一 条 被 执行 命令 的 状态 将 被 用 作为 返回 值 。 在 脚本 程序 中 提供 一 个 退 
出 码 总 是 一 个 恨 好 的 习惯 。 

在 shell 脚 本 编程 中 ， 退 出 码 0 表示 成 功 ， 退 出 码 1 一 125 是 脚本 程序 
可 以 使 用 的 错误 代码 。 其 余数 字 具 有 保留 含义 ， 如 表 2-7 所 示 。 


表 2-7 
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HORREEI TIFE C/C++ RF RU RT BEAR EAN So TERRI AR 
程序 中 ， 这 种 做 法 的 一 大 优点 是 : 它 使 得 你 可 以 使 用 多 达 125 个 用 户 目 
定义 的 错误 代码 ， 而 不 需要 使 用 一 个 全 局 的 错误 代码 变量 。 

下 面 是 一 个 简单 的 例 手 ， 如 有 果 当 前 目 孙 下 存在 一 个 名 为 .profile 的 
文件 ， 它 驶 返回 0 表示 成 功 : 


如 条 你 征 个 精 巷 求 精 的 人 ， 或 至 少 追 求 更 简洁 的 脚本 ， 那 么 你 可 
人 a 只 需 
一 行 代码 : 


[ -f .profile ] && exit 0 || exit 1 
9.export fii 4 
export 命 令 将 作为 它 参 数 的 变量 导出 到 子 shell 中 ， 并 使 之 在 子 shell 
中 有 效 。 在 默认 情况 下 ， 在 一 个 shell 中 被 创建 的 变量 在 这 个 shell 调 用 
的 下 级 (F) shell 中 是 不 可 用 的 。export 命 令 把 自己 的 参数 创建 为 一 个 
环境 变量 ， 而 这 个 环境 变量 可 以 被 当前 程序 调用 的 其 他 脚本 和 程序 看 
见 。 从 更 技术 的 角度 来 说 ， 被 导出 的 变量 构成 从 该 shell 衍 生 的 任何 子 
E e 我们 用 下 面 两 个 脚本 程序 exportL 和 export2 来 说 明 它 
Y 1 o 


Sc 验 导出 变量 
(1) 我 们 先 列 出 脚本 程序 export2: 


(2) 然后 是 脚本 程序 export1。 在 这 个 脚本 的 结尾 ， 我 们 调用 了 


export2: 


如 果 你 运行 这 个 脚本 程序 ， 你 将 得 到 如 下 的 输出 : 


xpo 


实验 解析 

export2 脚 本 只 是 回 显 两 个 变量 的 值 。export1 脚 本 同时 设置 两 个 变 
量 ， 但 只 导出 变量 bar， 所 以 当 它 其 后 调用 export2 时 ， 变 量 foo 的 值 已 
丢失 ， 但 变量 bar 的 值 已 被 导出 到 第 二 个 脚本 中 。 脚 本 输出 中 第 一 个 空 
ATHY Hi Bie IUS $ foo 在 export2 中 没有 定义 ， 回 显 一 个 nu 变量 将 输出 
一 个 空 行 。 

一 旦 一 个 变量 被 shell 导 出 ， 它 就 可 以 被 该 shell 调 用 的 任何 脚本 使 
用 ， 也 可 以 被 后 续 依 次 调用 的 任何 shell 使 用 。 如 果 脚 本 export2 调 用 了 
另 一 个 脚本 ，bar 的 值 对 新 脚本 来 说 仍然 有 效 。 


set -a 或 set -allexport 命 令 将 导出 它 之 后 声明 的 所 有 变量 。 


10. expr 命令 
expr 命 令 将 它 的 参数 当 作 一 个 表达 式 来 求 值 。 它 的 最 常见 用 法 就 
是 进行 如 下 形式 的 和 俏 单 数学 运 售 
x= expr Sx + 1 
反 引 号 CO) 字符 使 x 取 值 为 命令 expr $x + 1 的 执行 结果 。 你 也 可 
DAIRY 0 替换 反 引 号 `“， 如 下 所 示 : 


x-S(expr $x + 1) 
expr 命 令 的 功能 十 分 强大 ， 它 可 以 完成 许多 表达 式 求 值 计 算 。 表 
2-8 列 出 了 主要 的 一 些 求 值 计 算 
2-8 
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(...) ) 语法 ， 这 个 我 们 会 在 本 章 后 面 的 内 容 中 介绍 。 

11. printf 命 令 

只 有 最 新 版 本 的 shell 才 提供 printf 命 令 。X/Open 规 范 建 议 我 们 应 该 
用 它 来 代 蔡 echo 命 令 ， 以 产生 格式 化 的 输出 ， 但 看 来 几乎 没什么 人 接 
受 这 一 建议 。 

它 的 语法 是 : 


— 9. - "E xe — de qiu ay " — - aan ^ M = antl 
printf Lormat String parameter. parameterZz 


格式 字符 串 与 COC++ 中 使 用 的 非常 相似 ， 但 有 一 些 目 己 的 限制 。 
主要 是 不 支持 浮 点 数 ， 因 为 shell 中 所 有 的 算术 运算 都 是 按照 整数 来 进 
行 计 算 的 。 格 式 字 符 串 由 各 种 可 打印 字符 、 转 义 序 列 和 字符 转换 限定 
符 组 成 。 格 式 字符 串 中 除了 2% 和 \ 之 外 的 所 有 字符 都 将 按 原样 输出 。 


表 2-9 列 出 了 它 支 持 的 转 义 序列 。 
表 2-9 
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SE DU 


FFF PPR IR rE FEA SR BEA ek BR) Wert DU BS FH 
法 。 更 详细 的 介绍 可 以 参考 bash 的 在 线 手 册 或 printf 在 线 手 册 的 第 一 部 
i (man 1 pit ^ 如果 在 手册 的 第 一 部 分 找 不 到 ， 你 可 以 笑 试 查找 
手册 的 第 三 o 字符 转 换 限 定 符 由 一 个 % 和 跟 在 后 面 的 一 个 转换 字 
符 组 成 。  EXÉMCS 符 如 表 2-10 所 示 。 


表 2-10 


字符 转换 最 定 符 说 aN 


wi TF 


i 格式 字符 串 然后 被 用 来 解释 printf 后 续 参 数 的 含义 并 输出 结果 。 例 
H: 
S ee "*s\n" hello 


$ ym dtm "%s “%d\t%s" "Hi There" 15 people 
Hi There 15 people 


注意 ， 你 必须 使 用 双 引 号 括 住 Hi There 字 符 串 ， 使 之 成 为 一 个 单 
独 的 参数 。 

12. return 命 令 

return a 命令 的 作用 是 使 函数 返回 。 我 们 在 前 面 介 绍 函 数 时 已 提 到 过 
它 。return 命 令 有 一 个 数值 参数 ， 这 个 参数 在 调用 该 钞 数 的 脚本 程序 里 
UB EAEAN EE 如 果 没 有 指定 参数 ，retum 命 令 默认 返回 最 
后 一 条 命令 的 退出 码 。 

13. st 


set 命 令 的 作用 是 为 shell 设 置 参 数 变量 。 许 多 命令 的 输出 结 采 是 以 


空格 分 隔 的 值 ， 如 采 需 要 使 用 输出 结果 中 的 某 个 域 ， 这 个 命令 天 非常 


用 。 

假设 你 想 在 一 个 shell 脚 本 中 使 用 当前 月 份 的 名 字 。 系 统 本 身 提供 
了 一 个 date 命 令 ， 它 的 输出 结果 中 包含 了 字符 串 形 式 的 月 份 名 称 ， 但 
征 你 需要 把 它 与 其 他 区 域 分 隔 开 。 你 可 以 将 set 命 令 和 圣 (...) 结构 相 
结合 来 执行 date 命 令 ， 并 且 返 回想 要 的 结果 。date 命 令 的 输出 把 月 份 字 
符 各 作为 它 的 第 二 个 参数 : 


这 个 程序 把 date 命 令 的 输出 设置 为 参数 列表 ， 然 后 通过 位 置 参数 
于 2 获得 月 份 。 

注意 ， 我 们 以 date 命 令 作 为 一 个 简单 的 例子 来 说 明 怎 么 提取 位 置 
参数 。 由 于 date 命 令 的 输出 受 本 地 语言 的 影响 较 大 ， 所 以 在 实际 工作 
中 ， 你 应 该 使 用 date +%B 命 令 来 提取 月 份 名 字 。 date 命 令 还 有 许多 其 
他 格式 远 项 ， 详 细 资 料 请 参考 它 的 手册 页 。 

你 还 可 以 通过 set 命 令 和 它 的 参数 来 控制 shell 的 执行 方式 。 其 中 最 


ae 人 o 

14. shift 命 

shift 命 令 把 所 有 参数 变量 左 移 一 个 位 置 ， 使 圣 2 变 成 鞋 1, $ 3 变 成 
对 2， 以 此 类 推 。 原 来 圣 1 的 值 将 被 丢弃 ， 而 $0 仍 将 保持 不 变 。 如 果 调 
用 shift 命 令 时 指定 了 一 个 数值 参数 ， 则 表示 所 有 的 参数 将 左 移 指 定 的 
~ 。$+*+、$@ 和 尘 # 等 其 他 变量 也 将 根据 参数 变量 的 新 安排 做 相应 的 
ZEB e 

在 扫 摘 处 理 脚 本 程序 的 参数 时 ， 经 常 要 用 到 shift 命 令 。 如 果 你 的 
脚本 程序 需要 10 个 或 10 个 以 上 的 参数 ， 你 就 需要 用 shift 命 令 来 访问 第 
十 个 及 其 后 面 的 参数 。 

例如 ， 你 可 以 像 下 面 这 样 依次 扫描 所 有 的 位 置 参 数 : 


15. trap 命 令 


trap 命 令 用 于 指定 在 接收 到 信号 后 将 要 采取 的 行动 ， 我 们 将 在 本 
书后 面 的 内 容 中 详细 介绍 信号 。trap 命 令 的 一 种 常见 用 途 是 在 脚本 程 
序 被 中 断 时 完成 清理 工作 。 历 史上 ，shell 总 是 用 数字 来 代表 信和 号， 但 
新 的 脚本 程序 应 该 使 用 信号 的 名 子 ， 它 们 定义 在 头 文件 signal. h 中 ， 在 
使 用 信号 名 时 需要 省 略 SIG 前 缀 。 你 可 以 在 命令 提示 符 下 输入 命令 trap 
-1 来 查看 信号 编号 及 其 关联 的 和 名称。 


对 于 那些 不 熟悉 信号 的 人 们 来 说 ， 信 和 号 是 指 那些 被 异步 发 送 
到 一 个 程序 的 事件 。 在 默认 情况 下 ， 它 们 通常 会 终止 一 个 程序 的 


运行 。 


trap 命 令 有 两 个 参数 ， 第 一 个 参数 是 接收 到 指定 信号 时 将 要 采取 
的 行动 ， 第 二 个 参数 是 要 处 理 的 信号 名 。 

trap command signal 

请 记 住 ， 脚 本 程序 通常 是 以 从 上 到 下 的 顺序 解释 执行 的 ， 所 以 你 
必须 在 你 想 保护 的 那 部 分 代码 之 前 指定 trap 命 令 。 

如 果 要 重 置 某 个 信和 号 的 处 理 方式 到 其 默认 值 ， 只 需 将 command 设 
置 为 一 。 如 有 果 要 忽略 某 个 信号 ， 丈 把 command 议 置 为 空 字符 串 "。 一 个 
不 带 参 数 的 trap 命 令 将 列 出 当前 设置 的 信号 及 其 行动 的 清单 。 

表 2-11 列 出 了 X/Open 规 范 里 面 规定 的 能 够 被 捕获 的 比较 重要 的 一 
些 信 号 〈 括 号 里 面 的 数字 是 对 应 的 信号 编号 ) 。 更 多 细 市 请 参考 signal 
在 线 手 册 的 第 7 部 分 (man 7 signal) . 


表 2-11 


实 验 信号 处 理 
下 面 的 脚本 演示 了 一 些 人 简单 的 信号 处 理 方 法 : 


如 果 你 运行 这 个 脚本 ， 在 每 次 循环 时 按 下 Ctrl+C 组 合 键 (或 任何 
你 系统 上 设 定 的 中 断 键 ) ， 将 得 到 如 下 所 示 的 输出 : 


reating file /tmp/my_tmp_ 
4 w^ i» m 9^ 921 和 MDT p 


File exists 
axists 
exis 


e exists 


实验 解析 

在 这 个 脚本 程序 中 ， 我 们 先 用 trap 命 令 安排 它 在 出 现 一 个 INT (中 
Wr) 信号 时 执行 rm-f/tmp/my_tmp_file_ $$ 命令 删除 临时 文件 。 脚 本 程 
序 然 后 进入 一 个 while 循 环 ， 只 要 临时 文件 存在 ， 循 环 就 一 直 持 续 下 
去 。 当 用 户 按 下 Ctrl+C 组 合 刍 时 ， 脚 本 程序 就 会 执行 rm-f /tmp/my_ 
tmp file $$ 语句 ， 然 后 继续 下 一 个 循环 。 因 为 临时 文件 现在 已 经 被 删 
除了 ， 所 以 第 一 个 while 循 环 将 正常 退出 。 

接 下 来 ， 脚 本 程序 再 次 调用 trap 命 令 ， 这 次 是 指定 当 一 个 INT 信 号 
出 现时 不 执行 任何 命令 。 脚 本 程序 然后 重新 创建 临时 文件 并 进入 第 二 
个 while 循 环 。 这 次 当 用 户 按 下 Ctrl+C 组 合 键 时 ， 没 有 语句 被 指定 执 
行 ， 所 以 采取 默认 处 理 方 式 ， 即 立即 终止 脚本 程序 。 因 为 脚本 程序 被 
立即 终止 了 ， 所 以 最 后 的 echo 和 exit 语 名 永远 都 不 会 被 执行 。 


16. unset 
unset 命 令 的 作用 是 从 环境 中 删除 变量 或 函数 。 这 个 命令 不 能 删除 
shell AE LAY Rik 《如 IFS) 。 这 个 命令 并 不 常用 。 
" P TAD HAAS 25 — UC C FF E Hello World， 但 第 二 次 只 输出 一 个 
行 符 : 


=) 


使 用 foo= 语 句 产生 的 效果 与 上 面 脚本 中 的 unset 命 令 产 生 的 效 
果 差 不 多 ， 但 并 不 等 同 。foo= 语 句 将 变量 foo 设 置 为 空 ， 但 变量 
foo 仍 然 存在 ， 而 使 用 unset foo 语 句 的 效果 是 把 变量 foo 从 环境 中 删 


~ o 


17. 另外 两 个 有 用 的 命令 和 正则 表达 式 

在 学 习 如 何 应 用 shell 编 程 中 的 这 个 新 知识 点 之 前 ， 让 我 们 再 来 看 
另外 两 个 非常 有 用 的 命令 ， 它 们 虽然 不 是 shell 的 一 部 分 ， 但 在 编写 
shell 程 序 时 经 常用 到 。 同 时 ， 我 们 也 将 介绍 正则 表达 式 ， 一 种 出 现在 
所 有 Linux 以 及 与 之 关联 程序 中 的 模式 匹配 特征 。 

。find 命 令 

你 将 看 到 的 第 一 个 命令 是 find。 这 是 个 用 于 搜索 文件 的 命令 ， 它 
极其 有 用 ， 但 Linux 初 学 者 常常 觉得 它 不 易 使 用 ， 这 不 仪 仅 是 因为 它 有 
选项 、 测 斌 和 动作 类 型 的 参数 ， 还 因为 其 中 一 个 参数 的 处 理 结果 可 能 
会 影响 到 后 续 参 数 的 处 理 。 

在 深入 研究 这 些 选项 、 测 试 和 参数 之 前 ， 让 我 们 首先 看 一 个 非常 
简单 的 例子 ， 它 用 来 在 本 地 机 器 上 查找 名 为 test 的 文件 。 为 了 确保 你 具 
有 搜索 整个 机 器 的 权限 ， 请 以 root 用 户 身份 来 执行 这 个 命令 : 


# find / -name test -print 
/usr/bin/test 

+ 
根据 你 所 使 用 系统 的 不 同 ， 你 可 能 还 会 找到 其 他 几 个 名 称 也 为 test 
的 文件 。 正 如 你 可 能 猜测 的 那样 ， 这 个 命令 的 含义 是 : 从 根 目录 开始 
查找 名 为 test 的 文件 ， 并 且 输 出 该 文件 的 完整 路 径 。 这 非常 简单 。 


然而 ， 这 个 命令 的 执行 确实 需要 花费 很 长 的 时 间 ， 并 且 网 络 上 的 
Windows 机 器 的 人 硬盘 也 会 高 速 转动 。 这 是 因为 Linux 机 器 挂 载 (使 用 
SAMBA) 了 一 大 块 Windows 机 器 的 文件 系统 ， 看 起 来 似乎 是 Windows 
尽管 我 们 知道 要 查找 的 文件 应 该 在 Linux 机 器 


这 束 古 我 们 要 介绍 的 第 一 个 选项 发 挥 作用 的 时 候 了 。 如 采 你 指定 - 
nonu 你 束 可 以 告诉 find 命 令 不 要 搜索 挂 载 的 其 他 文件 系统 的 目 


# find / -mount -name test -print 
/usr/bin/test 
# 
我 们 仍然 能 找到 文件 ， 但 这 次 搜索 速度 会 更 快 ， 同 时 也 不 必 再 搜 
索 挂 载 的 其 他 文件 系统 。 
find 命 令 的 完整 语法 格式 如 下 所 示 : 
find [path] [options] [tests] [actions] 
path 部 分 很 容易 理解 : 你 既 可 以 使 用 绝对 路 径 ， 如 /bin， 也 可 以 使 
用 相对 路 径 ， 如 . 。 如 果 需 要 ， 你 也 可 以 指定 多 个 路 径 ， 如 


find/var/home. 


find 命 令 有 许多 选项 可 用 ， 表 2-12 列 出 了 一 些 主要 的 选项 。 
He 2-12 


= x 


下 面 是 测试 部 分 。 可 以 提供 给 find 命 令 的 测试 非常 多 ， 每 种 测试 
返回 的 结果 有 两 种 可 能 ，true 或 false。find 命 令 开 始 工作 时 ， 它 按照 顺 
序 将 定义 的 每 种 测试 依次 应 用 到 它 搜索 到 的 每 个 文件 上 。 如 果 一 个 测 
wuk [E] false, find 命 令 吏 停止 处 理 它 当 前 找到 的 这 个 文件 ， 并 继续 搜 
索 。 如 果 一 个 测试 返回 true, find 命 令 将 继续 下 一 个 测试 或 对 当前 文件 
采取 行动 。 表 2-13 只 列 出 了 最 第 用 的 测试 ， 请 参考 find 命 令 的 手册 页 以 
了 解 所 有 可 以 使 用 的 测试 。 


表 2-13 


你 还 可 以 用 操作 符 来 组 合 测试 。 大 多 数 操作 符 有 两 种 格式 ， 短 格 
式 和 长 格式 ， 如 表 2-14 所 示 。 
表 2-14 


mihi? test O R KRR t£ x 


IPMN PRA HK 


你 可 以 通过 使 用 圆 括号 来 强制 测试 和 操作 符 的 优先 级 。 由 于 圆 括 
号 对 shell 来 说 有 其 特殊 的 售 义 ， 所 以 你 还 必须 使 用 反 斜 线 来 引用 圆 括 
号。 此 外 ， 如 果 你 在 文件 名 处 使 用 的 是 匹配 模式 ， 你 就 必须 在 模式 上 
使 用 引号 以 确保 模式 没有 被 shell 扩 展 ， 而 是 直接 传递 给 find 命 令 。 例 
如 ， 如 果 你 想 写 一 个 测试 “搜索 的 文件 比 文件 X 要 新 ， 或 者 文件 名 以 下 
划 线 开头 ”， 你 可 以 这 样 写 : 


\(-newer X -o -name " *" \) 


我 们 将 在 下 一 个 “实验 解析 ”部 分 之 后 举 这 样 一 个 例子 。 


实 验 使 用 带 测 试 的 find 命 令 
在 当前 目录 下 搜索 比 文 件 while2 要 新 的 文件 : 


5 find . -newer while2 -print 


这 个 结果 看 起 来 不 错 ， 不 过 在 结 采 中 还 包括 了 当前 目录 ， 而 这 并 
人 你 只 对 普通 文件 感 兴 趣 。 所 以 你 会 增加 一 个 额外 的 测 
iz\-type f: 


$ find . -newer while2 -type f -print 
elif3 


^n + a+ 
WOras. tx 
trap 


Am 


实验 解析 

它 是 如 何 工作 的 呢 ? 你 指定 find 命 令 应 该 在 当前 目录 C) 中 搜索 
比 文件 while2 要 新 的 文件 (-newer while2) ， 如 果 这 个 测试 通过 ， 然 后 
再 测试 这 个 文件 是 否 是 一 个 普通 文件 Ctypef) 。 最 后 ， 你 使 用 前 面 
已 经 讲 过 的 -print 来 确认 搜索 到 的 文件 。 

现在 来 查找 以 下 划 线 开头 的 文件 或 比 while2 文 件 要 新 的 文件 ， 但 
在 两 种 情况 下 都 必须 是 普通 文件 。 这 个 例子 将 演示 如 何 使 用 圆 括号 来 
对 测试 进行 组 合 : 


5 find. -nane " * 


可 以 看 出 完成 这 个 任务 并 不 是 很 困难 。 你 必须 转 义 圆 括号 使 得 它 
们 个 会 被 shell 处 再， 而 且 还 需要 将 * 号 用 引号 括 起 使 得 它 彼 下 接 代 递 给 
find 命 令 。 

现在 你 已 可 以 可 靠 地 搜索 文件 了 。 下 面 来 看 看 在 发 现 匹配 指定 条 
件 的 文件 之 后 ， 你 可 以 执行 的 动作 。 表 2-15 只 列 出 了 最 常见 的 动作 ， 
完整 的 动作 列表 请 见 find 命 令 的 手册 页 。 

-exec 和 -ok 命令 将 命令 行 上 后 续 的 参数 作为 它们 参数 的 一 部 分 ， 直 
到 被 序列 终止 。 实 际 上 ，-exec 和 -ok 命令 执行 的 是 一 个 嵌入 式 命令 ， 所 
以 租 入 式 命 令 必须 以 一 个 转 义 的 分 号 结束 ， 使 得 find 命 令 可 以 决定 什 
么 时 候 它 可 以 继续 查找 用 于 它 上 自己 的 命令 行 选项 。 魔 术 字 符 串 {}o 是 - 
E E R 


表 2-15 


SHreete 


上 面 的 解释 可 能 并 不 容易 理解 ， 但 通过 一 个 例子 可 以 将 其 解释 得 
更 清楚 。 我 们 来 看 一 个 比较 简单 的 例子 ， 它 使 用 一 条 非常 安全 的 命令 
Is: 


$ find . -newer while2 -type f -exec ls -1 () V; 


”如 你 所 见 ，find 命 令 非 第 有 用 。 你 只 需 通 过 一 点 练习 束 可 以 很 好 
地 和 掌握 它 。 无 论 如 何 ， 这 所 练习 是 完全 值得 的 ， 所 以 请 使 用 find 命 令 
来 进行 实验 。 


我 们 将 介绍 的 第 二 个 非常 有 用 的 命令 是 grep ， 这 个 不 寻常 的 名 字 
代表 的 是 通用 正则 表达 式 解 析 器 (General Regular Expression Parser, 
简写 为 grep) 。 你 使 用 find 命 令 在 系统 中 搜索 文件 ， 而 使 用 grep 命 令 在 
文件 中 搜索 字符 嘻 。 事 实 上 ， 一 种 非常 常见 的 用 法 是 在 使 用 find 命 令 
上 时， 将 grep 作 为 传递 给 -exec 的 一 条 命令 。 

grep 命 令 使 用 一 个 选项 、 一 个 要 匹配 的 模式 和 要 搜索 的 文件 ， 它 
的 语法 如 下 所 示 : 


grep [options] PATTERN [FILES] 


如 果 没 有 提供 文件 名 ， 则 grep 命 令 将 搜索 标准 输入 。 
我 们 首先 来 得 看 grep 命 令 的 一 些 主要 选项 ， 它 们 列 在 了 表 2-16 
中 ， 完 整 的 选项 列表 请 见 grep 命 令 的 手册 页 。 


X 2-16 


Sc 验 基本 的 grep 命 令 用 法 
`, " ^ A 
我 们 来 看 一 些 使 用 grep 命 令 的 简单 例子 : 
$ grep in words.txt 
When shali we three meet jain. In thunder, lightning, or in rain? 
. ag E words2.txt 
words. txt:1d 


S grep -c -v in words.txt words2.txt 
words.txt:9 


wordsz.txt:1ib 


实验 解析 
第 一 个 例子 未 使 用 选项 ， 它 只 是 在 文件 words. txt 中 搜索 字符 串 
ae Ur iti DCA 。 文 件 名 未 输出 是 因为 你 只 在 一 个 文件 中 进行 
第 二 个 例子 在 两 个 不 同 的 文件 中 计算 匹配 行 的 数目 。 。 在 这 种 情况 
ips ua 
jn 一 个 例子 使 用 -v 选 项 对 搜索 取 反 ， 在 两 个 文件 中 计算 不 匹配 
行 的 数目 。 


* 正则 表达 式 

正如 你 所 看 到 的 ，grep 命 令 的 基本 用 法 非常 容易 掌握 。 现 在 是 时 
候 介 绍 正则 表达 式 的 基础 知识 了 ， 它 允许 你 实现 更 复杂 的 匹配 。 正 如 
我 们 在 本 章 前 面 提 到 的 那样 ， 正 则 表达 式 被 广泛 应 用 于 Linux 和 许多 其 
他 开源 编程 语言 中 。 你 可 以 在 vi 编辑 旨 或 Perl 脚 本 中 使 用 它们 ， 而 且 不 

论 它 们 出 现在 哪里 ， 其 基本 原理 都 是 一 样 的 。 

在 正则 表达 式 的 使 用 过 程 中 ， 一 些 字符 是 以 特定 方式 处 理 的 。 最 

常 使 用 的 特殊 字符 如 表 2-17 所 示 。 
A 2-17 


T WW" * x 


HAMEEN 
d£ V 9n 1 t Bhi dame 其 中 任何 P27 El LA err E Na ~e REY 
E mg d CRAIN, WACOM Ie 


如 果 想 将 上 述 字 EH DEFI, Wire fe El] A EA IE ° 
例如 ， 如 采 想 使 用 圣 字 符 ， 你 。 需 要 将 它 写 为 \$. 
FETT d& 9 "Ph nup UL Hl — EA RITE RR TCR oe 如 表 2-18 所 


ZW? 


Ak 2-18 


匹配 模式 = x 
[FE ] T n 
rh 
ASCIF? 7] 
"Hrs 
ASCIH? MF? 
n? 
Is "ih? 
(5) 
Kus (1 x 


WAR 


另外 ， 如 果 指 定 了 用 于 扩展 匹配 的 -B 选 项 ， 那 些 用 于 控制 匹配 完 
成 的 其 他 字符 可 能 会 遵循 正则 表达 式 的 规则 ( 见 表 2-19) 。 对 于 grep 
命令 来 说 ， 我 们 还 需要 在 这 些 字符 之 前 加 上 \ 字 符 。 


X 2-19 


{> 4 
1^ 201 
Hia 
PEAR eB I. Unam 


这 看 上 去 有 点 复杂 ， 但 如 采 你 实际 应 用 它 ， 将 会 发 现 它 并 不 像 第 
眼看 上 去 那么 复 洒 。 掌 握 正则 表达 式 的 最 简单 方法 就 十 笑 试 一 些 实 


验 。 
(1) 我 们 的 第 一 个 例子 是 查找 以 字母 e 结 尾 的 行 。 你 可 能 会 猜 到 
需要 使 用 特殊 字符 鞋 ， 如 下 所 示 : 
$ grep e$ words2.txt 
Art thou not, fatal vision, 
I see thee yet, in form as palpable 


dead, and wicked dreams abuse 


RARA 
ss — 9 
SR S£ SE 5 


sensible 


Nature seems 


如 你 所 见 ， 这 个 命令 找到 了 以 字母 e 结 尾 的 行 。 
(2) 现在 假设 想 要 查找 以 字母 a 结 尾 的 单词 。 要 完成 这 一 任务 ， 
你 需要 使 用 方 括号 括 起 的 特殊 匹配 字符 。 在 本 例 中 ， 你 将 使 用 的 是 


[[:blank:]]， 它 用 来 测试 空格 或 制 表 符 : 


$ grep a[[:blank:]] words2.txt 


Is this a dagger which I see before me, 
A dagger of the mind, a faise creation, 
Moves like a ghost. Thou sure and firm-set earth, 


(3) 下 面 我 们 来 查找 以 Th 开头 的 由 3 个 字母 组 成 的 单词 。 在 本 例 
中 ， 你 既 需 要 使 用 [[: space: ]] 来 划 定 单词 的 结尾 ， 还 需要 用 字符 C) 
来 匹配 一 个 额外 的 字符 : 


$ grep Th.[[:space:]] words2.txt 


ward my hand? Come, let me clutch thee. 
The curtain'd sleep; witchcraft celebrates 
Thy very stones prate of my whereabout, 


(4) 最 后 ， 我 们 用 扩展 grep 模 式 来 搜索 只 有 10 个 字符 长 的 全 部 由 
小 写字 母 组 成 的 单词 。 我 们 通过 指定 一 个 匹配 字母 a 到 z 的 字符 范围 和 
一 个 重复 10 次 的 匹配 来 完成 这 一 任务 : 


$ grep -E [a-z]\{10\} words2.txt 


Proceeding from the heat-oppressed brain? 
AI uch an instrume I wa 

rhe irtain slee ^ cele e 
Thy very stones prate of my whereabout, 


”我 们 在 这 里 只 涉及 了 正则 表达 式 中 最 重要 的 内 容 。 与 Linux 中 大 多 
数 事物 一 样 ， 系 统 中 的 大 量 文档 可 以 帮助 你 了 解 更 多 的 细节 ， 但 学 习 
正则 表达 式 最 好 的 方法 是 实际 操作 。 


2.6.6 ”命令 的 执行 


编写 脚本 程序 时 ， 你 经 常 需要 捕获 一 条 命令 的 执行 结果 ， 并 把 它 
用 在 shell 脚 本 程序 中 。 也 就 是 说 ， 你 想 要 执行 一 条 命令 ， 并 把 该 命令 
的 输出 放 到 一 个 变量 中 。 

你 可 以 用 在 本 章 前 面 set 命 令 示 例 中 介绍 的 半 (command) 语法 来 
{A FP Eee BY er TY PV ‘command’, 这 种 用 法 目前 依 
然 很 常见 。 


请 注意 ， 在 脚本 程序 里 执行 命令 的 比较 老 的 语法 形式 时 ， 使 
用 的 是 反 引 号 C) ， 而 不 是 我 们 在 前 面 使 用 的 单 引号 C) CA 
引号 的 作用 是 防止 变量 扩展 ) 。 只 有 当 你 需要 使 自己 的 脚本 程序 
具备 非常 好 的 可 移植 性 时 ， 你 才 应 该 使 用 这 种 比较 老 的 方法 。 


所 有 的 新 脚本 程序 都 应 该 使 用 对 〈…) 形式 ， 引 入 这 一 形式 的 目 
的 是 为 了 避免 在 使 用 反 引 号 执行 命令 时 ， 处 理 其 内 部 的 $、`”、\ 等 字 
符 所 需要 应 用 的 相当 复杂 的 规则 。 如 果 在 反 引 号 `.… 结构 中 需要 用 到 
BOSS, SUD NOE VE HET EO o KHER HERA E13 GE CE E 
程序 员 感 到 困惑 ， 有 时 即使 是 经 验 丰 富 的 shell 脚 本 程序 员 也 必须 反复 
进行 实验 ， 才 能 确保 在 反 引 号 命令 中 引号 的 使 用 不 会 出 错 。 

$ (command) 的 结果 就 是 其 中 命令 的 输出 。 注 意 ， 这 不 是 该 命令 


的 退出 状态 ， 而 古 它 的 字符 串 形 式 的 输出 结果。 例如: 


因为 当前 目录 是 一 个 shell 环 境 变量 ， 所 以 程序 的 第 一 行 不 需要 使 
用 这 个 命令 执行 结构 。 但 如 果 我 们 想 要 在 脚本 程序 中 使 用 who 命 令 的 
输出 结果 ， 就 需要 使 用 这 个 结构 。 

如 果 想 要 将 命令 的 结果 放 到 一 个 变量 中 ， 你 可 以 按 通 常 的 方法 来 
给 它 赋值 ， 如 下 所 示 ; 


whoisthere=S (who) 
echo Swhoisthere 


这 种 把 命令 的 执行 结果 放 到 变量 中 的 能 力 是 非常 强大 的 ， 它 使 得 
在 脚本 程序 中 使 用 现 有 命令 并 捕获 其 输出 变 得 很 容易 。 如 果 需 要 把 一 
条 命令 在 标准 输出 上 的 输出 转换 为 一 组 参数 ， 并 且 将 它们 用 做 为 另 一 
个 程序 的 参数 ， 你 会 发 现 命 令 xargs 可 以 帮 你 完成 这 一 工作 。 有 具体 细节 
请 参考 它 的 手册 页 。 

有 时 ， 当 你 打算 调用 的 命令 在 输出 你 想 要 的 内 容 之 前 先 输 出 了 一 
些 空白 字符 ， 或 者 它 输 出 的 内 容 比 你 想 要 的 要 多 的 时 候 也 会 出 现 问 
题 。 此 时 ， 你 可 以 用 前 面 介绍 的 set 命 令 来 解决 。 

1. 算术 扩展 

我 们 己 经 介绍 过 expr 命 令 ， 通 过 它 可 以 处 理 一 些 人 简单 的 算术 命 
令 ， 但 这 个 命令 执行 起 来 相当 慢 ， 因 为 它 需 要 调用 一 个 新 的 shell 来 处 


理 expr 命 令 。 

一 种 更 新 更 好 的 办 法 是 使 用 ( 6.) ) 扩展 。 把 你 准备 求 值 的 表 
达 式 括 在 $ ( (...) ) 中 能 够 更 有 效 地 完成 简单 的 算术 运算 。 如 下 所 
ZN: 


注意 ， 这 与 命令 不 同 ， 两 对 圆 括号 用 于 算术 替换 ， 而 我 们 之 
前 见 到 的 一 对 圆 括号 用 于 命令 的 执行 和 获取 输出 。 


2. 参数 扩展 
你 已 经 见 过 形式 最 简单 的 参数 赋值 和 扩展 了 ， 如 下 所 示 : 


但 当 你 想 在 变量 名 后 附加 额外 的 字符 时 就 会 遇 到 问题 。 假 设 你 想 
编写 一 个 简短 的 脚本 程序 ， 来 处 理 名 为 1 tmp 和 2_tmp 的 两 个 文件 。 你 
可 能 会 这 样 写 : 

#!/bin/sh 


for 1 in 1 2 
do 

my secret process $i tmp 
done 


但 是 在 每 次 循环 中 ， 你 都 会 看 到 如 下 所 示 的 出 错 信 息 : 


my_secret_process: too few arguments 


UE mes ru? 

问题 在 于 shell 试 图 替换 变量 圣 i_ tmp 的 值 ， 而 这 个 变量 其 实 并 不 存 
在 .shell 并 不 会 认为 这 是 一 个 错误 ， 仅 仅 会 将 它 替换 为 一 个 空 值 ， 因 此 
根本 不 会 有 参数 被 传递 给 my_ secret_process。 为 了 保护 变量 名 中 类 似 
于 圣 j 部 分 的 扩展 ， 你 需要 把 i 放 在 花 括 号 中 ， 如 下 所 示 : 


在 每 次 循环 中 ， 变 量 i 的 值 蔡 换 了 $ (i) ， 从 而 给 出 正确 的 文件 
名 。 也 就 是 说 ， 你 把 参数 的 值 礁 换 进 了 一 个 字符 串 。 

你 可 以 在 shell 中 采用 多 种 参数 蔡 换 方法 。 对 于 多 参数 处 理 问题 来 
说 ， 这 些 方法 通常 会 提供 一 种 精巧 的 解决 方案 。 表 2-20 列 出 了 一 些 向 
见 的 参数 扩展 方法 。 


表 2-20 


参数 扩展 


ie 
GM Ki MEE, SALEM eats 
' T XUL. 
' 


ret y 


SEER AT BINS, IUECERMÉOB Ae RB AY o rae be Os 
符 串 进行 部 分 删除 的 最 后 4 个 参数 扩展 方法 ， 在 处 理 文件 名 和 路 人 径 时 非 
党 有 用 ， 请 看 下 面 的 例子 。 


Sc 验 参数 的 处 理 
" 下 面 脚本 程序 的 各 个 部 分 分 别 演示 了 各 种 参数 匹配 操作 符 的 用 
YE: 


! à t local/networ 


它 的 输出 结果 如 下 : 


bar 

fud 
usr/bin/X11/startx 
startx 
/usr/local/etc 
/usr 


实验 解析 

第 一 条 语句 ${foo: -bar} 给 出 的 值 是 bar， 这 是 因为 在 这 条 语句 执行 
时 foo 没 有 值 。 这 条 语句 执行 后 ， 变 量 foo 未 发 生变 化 ， 它 还 停留 在 未 
设置 状态 。 


如 果 这 条 语句 是 ${ffoo: =bar} ， 那 么 变 fy foo 就 会 被 赋值 。 这 
个 字符 串 操 作 符 的 作用 是 ， 检 查 变 量 foo 是 否 存在 且 不 为 空 。 如 果 
es 就 返回 它 的 值 ， 否 则 就 把 变量 foo 赋 值 为 bar 并 返回 这 
| o 
$ (foo: ? bar} 语 句 将 在 变量 foo 不 存在 或 它 设置 为 空 的 情况 
下 ， 输 出 foo: bar 并 异常 终止 脚本 程序 。 最 后 ，$ (foo: +bar} 语 句 
将 在 变量 foo 存 在 且 不 为 空 的 情况 下 返回 bar。 选 择 可 太 多 了 ! 


{foo#*/} 语 句 仅 仅 匹 配 并 删除 最 左边 的 /，( 记 住 ，* 匹 配 零 个 或 多 
个 字符 ) 。{foo# 大 */} 语 句 匹 配 并 删除 尽 可 能 多 的 字符 ， 所 以 它 删除 最 
右边 的 /及 其 前 面 的 所 有 字符 。 

{bar%local*} 语 句 匹 配 从 右边 起 直到 第 一 次 出 现 local (及 跟 在 它 
后 面 的 所 有 字符 ) ， 而 {bar:%%local*} 语 句 则 从 右边 起 尽 可 能 多 地 匹 
配 字 符 ， 直 到 过 到 最 靠 左 边 的 local 。 

为 UNIX 和 Linux 系 统 都 非常 依赖 过 滤器 的 思想 ， 所 以 一 个 操作 
的 结果 常常 必须 手工 进行 重 定向 。 假 设 你 想 使 用 cjpeg 程 序 将 一 个 GIF 
文件 转换 为 一 个 JPEG 文 件 : 


$ cjpeg image.gif > image.jpg 


但 有 时 ， 你 可 能 希望 对 大 量 文 件 执行 这 类 操作 ， 那 么 如 何 实现 目 
EERIE? 很 商 单 ， 像 下 面 这 样 做 即 可 : 


这 个 脚本 名 为 giftojpeg， 它 为 当前 目录 中 的 每 个 GIF 文件 创建 一 个 
对 应 的 JPEG 文 件 。 


2.6.7 here SRY 


在 shell 脚 本 程序 中 癌 一 条 命令 传递 输入 的 一 种 特殊 方法 是 使 用 
here 文 档 。 它 允许 一 条 命令 在 获得 输入 数据 时 就 好 像 是 在 读 取 一 个 文 
件 或 键盘 一 样 ， 而 实际 上 是 从 脚本 程序 中 得 到 输入 数据 o 

here 文 档 以 两 个 连续 的 小 于 号 << 开 始 ， 紧 跟着 一 个 特殊 的 字符 序 
列 ， 该 序列 将 在 文档 的 结尾 处 再 次 出 现 。<< 是 shell 的 标签 重 定 同 符 ， 
在 这 里 ， 它 强制 命令 的 输入 是 一 个 here 文 档 。 这 个 特殊 字符 序列 的 作 
用 就 像 一 个 标记 ， 它 告诉 shell here 文 档 结 束 的 位 置 。 因 为 这 个 标记 序 
列 不 能 出 现在 传递 给 命令 的 文档 内 容 中 ， 所 以 应 该 尽量 使 它 既 容易 记 
忆 又 相当 不 寻常 。 


x 验 使 用 here 文 档 
最 人 简单 的 例子 束 是 给 cat 命 令 提供 输入 数据 ， 如 下 所 示 : 


soy 


它 的 输出 如 下 所 未: 


hello 

this is a here 

document 

here 文 档 功 能 可 能 看 起 来 相当 奇怪 ， 但 其 实 它 的 作用 很 大 。 因 为 
它 可 以 用 来 调用 交互 式 的 程序 ， 比 如 一 个 编辑 器 ， 并 向 它 提供 一 些 事 
先 定 义 好 的 输入 。 但 它 更 常见 的 用 途 是 在 脚本 程序 中 输出 大 量 的 文 
本 ， 就 像 你 在 刚才 的 示例 中 看 到 的 那样 ， 从 而 可 以 避免 用 echo 语 句 来 


a (1) 来 确保 不 会 引 
EH ° 

如 有 果 想 按 预 定 的 方式 处 理 一 个 文件 中 的 几 行 ， 你 可 以 使 用 ed 行 编 
辑 伙 ， 并 在 脚本 程序 中 通过 here 文 档 同 它 提 供 命令 。 


x E here 文 档 的 另 一 个 用 法 
(1) 我 们 从 名 为 a_text_file 的 文件 开始 ， 它 的 内 容 如 下 所 示 : 


(2) 你 可 以 通过 结合 使 用 here 文 档 和 ed 编辑 器 来 编辑 这 个 文件 : 


That was line 4 


实验 解析 

这 个 脚本 程序 只 是 调用 ed 编辑 器 并 回 它 传递 命令 ， 先 让 它 移动 到 
第 三 行 ， 然 后 删除 该 行 ， 再 把 当前 行 《因为 第 三 行 刚刚 被 删除 了 ， 所 
以 当前 行 现在 就 是 原来 的 最 后 一 行 ， 即 第 四 行 ) 中 的 is 替换 为 was。 完 
成 这 些 操作 的 ed 命令 来 目 脚本 程序 中 的 here 文 档 在 标记 |! 
FunkyStuff! 之 间 的 那些 内 容 。 


注意 ， 我 们 在 here 文 档 中 用 \ 字 符 来 防止 鞋 字符 被 shell 扩 展 。 
\ 字 符 的 作用 是 对 鞋 进行 转 义 ， 让 shell 知 道 不 要 尝试 把 六 3/is/was/ 
扩展 为 它 的 值 ， 而 它 也 确实 没有 值 .shell 把 \$ 传 递 为 $， 再 由 ed 编辑 
器 对 它 进行 解释 。 


脚本 程序 的 调试 通常 都 很 容易 ， 但 并 没有 特定 的 工具 帮助 我 们 进 
行 调试 。 在 本 市 中 ， 我 们 将 简单 讲述 一 些 常 用 的 方法 。 

出 现 错误 时 ，shell 一 般 都 会 打印 出 包含 错误 的 行 的 行 号 。 如 有 果 这 
个 错误 并 不 古 非 第 明显 ， 你 可 以 添加 一 些 额外 的 echo 语 句 来 显示 变量 
的 内 容 ， 也 可 以 通过 在 shell 中 交互 式 地 输入 代码 片段 来 对 它们 进行 测 


试 。 

因为 脚本 程序 是 解释 执行 的 ， 所 以 在 脚本 程序 的 修改 和 重 斌 过程 
中 没有 编译 方面 的 额外 开支 。 跟 踪 脚 本 程序 中 复杂 错误 的 主要 方法 是 
设置 各 种 shell 选 项 。 为 此 ， 你 可 以 在 调用 shell 时 加 上 命令 行 选项 ， 或 
是 使 用 set 命 令 。 表 2-21 列 出 了 各 种 选项 。 


表 2-21 


你 可 以 用 -o 选 项 局 用 set 命 令 的 选项 标志 ， 用 +o 选 项 取消 设置 ， 对 
简写 版 本 也 是 一 样 的 处 理 方法 。 你 可 以 通过 使 用 xtrace 选 项 来 得 到 一 份 
简单 的 执行 跟 踩 报告。 在 调试 的 初始 阶段 ， 你 可 以 先 使 用 命令 行 选项 
的 方法 ， 但 如 果 想 获得 更 好 的 调试 效果 ， 你 可 以 将 xtrace 标 志 (用 来 启 
用 或 关闭 执行 命令 的 跟踪 ) 放 到 脚本 程序 中 问题 代码 的 前 后 。 执 行 跟 
踩 功能 让 shell 在 执行 每 行 语句 之 前 ， 先 输出 该 行 并 对 该 行 中 变量 进行 


T 下 面 的 命令 来 局 用 xtrace 选 项 : 
set -o xtrace 
再 用 下 面 的 命令 来 天 闭 xtrace 选 项 : 
set +o xtrace 
默认 情况 下 ， 变 量 扩展 的 层次 由 每 行 代码 前 的 + 号 个 数 指出 。 你 


可 以 通过 对 shell 配 置 文件 中 的 shell 变 量 PS4 进 行 设 置 ， 将 + 号 修改 为 更 
有 意义 的 字符 。 


在 shell 中 ， 你 还 可 以 通过 捕获 EXIT 信 号 ， 从 而 在 脚本 程序 退出 时 
Er Sis 。 具体 做 法 是 在 脚本 程序 的 开始 处 添加 类 似 下 面 这 
JAR ba HJ: 


rap ‘echo Exiting: critical variable = $critical variable’ EXIT 


2.7 JOG: dialog LA 


在 结束 讨论 shell 脚 本 程序 之 前 ， 我 们 还 将 介绍 一 个 特性 。 尽 管 严 
格 来 说 ， 它 并 不 是 shell 的 一 部 分 ， 但 是 在 通 闻 情况 下 ， 它 仅仅 在 shell 
程序 设计 中 有 用 ， 所 以 我 们 将 在 这 里 讨论 它 。 

如 采 你 知道 你 的 脚本 程序 只 需要 运行 在 Linux 探 制 台 上 ， 则 可 以 使 
用 dialog 工 具 命 令 ， 它 以 一 种 非常 整洁 的 方式 润色 你 的 脚本 程序 。 这 个 
命令 使 用 文本 模式 的 图 形 和 色彩 ， 但 它 的 确 提 供 了 友好 的 面向 图 形 的 


解决 方案 。 


一 些 Linux 发 行 版 默认 并 没有 安装 dialog 工 具 。 例 如 ， 对 于 
Ubuntu 来 说 ， 你 可 能 必须 添加 公开 维护 的 套件 库 来 找到 一 个 现成 
的 版 本 。 在 其 他 Linux 发 行 版 中 ， 你 可 能 会 找到 一 个 已 安装 的 替 
代 工 具 gdialog。 它 和 dialog 工 具 非 常 相似 ， 但 它 依赖 GNOME 用 
户 接口 来 显示 其 对 话 框 。 然 而 ， 你 得 到 的 回报 是 你 获得 了 一 个 真 
正 的 图 形 化 界面 。 一 般 来 说 ， 你 可 以 将 任何 使 用 dialog 工 具 的 和 
序 中 对 dialog 工 具 的 调用 替换 为 对 gdialog 工 具 的 调用 ， 从 而 获得 
a 。 我 们 将 在 本 节 最 后 提供 一 个 使 用 gdialog 

程序 示例 。 


dialog 工 具 的 整体 思想 非常 简单 : 一 个 带 有 各 种 各 样 参 数 和 选项 的 
程序 ， 它 可 以 显示 各 种 类 型 的 图 形 框 ， 艺 围 涵 关 从 最 稍 单 的 Yes/No 杠 
到 输入 框 ， 甚 至 菜单 选项 。 这 个 工具 通常 在 用 户 执行 某 种 类 型 的 输入 
后 返回 ， 返 回 结果 可 以 通过 退出 状态 获得 ， 或 在 用 户 输入 文本 时 ， 通 
过 标准 错误 流 来 获取 。 

在 详细 介绍 它 之 前 ， 我 们 先 来 看 一 个 非 第 位 单 的 使 用 dialog 的 例 
子 。 你 可 以 在 命令 行 上 直接 使 用 dialog， 这 对 于 程序 的 原型 设计 很 有 
cl uir eee 来 显示 传统 意义 上 的 第 一 个 

F: 


DUT CMS TE DRE NT AE OA ME, TK RT DOK XT 
话 框 关闭 它 ( 见 图 2-3) . 


现在 你 已 看 出 dialog 的 使 用 非常 容易 ， 接 下 来 我 们 对 它 的 各 种 可 能 
性 进行 详细 地 介绍 。 表 2-22 列 出 了 你 可 以 创建 的 对 话 框 的 主要 类 型 。 


表 2-22 
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还 有 一 些 其 他 的 对 话 框 类 型 例如， 进度 框 和 密码 框 ) 可 用 。 如 
果 你 想 了 解 更 多 不 常用 的 对 话 框 类 型 ， 你 也 可 以 参考 在 线 手 册页 。 

如 采 想 获得 任何 类 型 的 允许 文本 输入 或 进行 选择 的 对 话 框 的 输 
出 ， 你 必须 捕获 标准 错误 流 ， 通常 是 把 它 指 同 某 个 临时 文件 以 便 后 续 
处 理 。 要 想 获 得 Yes/No 对 话 框 的 输出 结果 ， 只 需 查 看 它 的 退出 码 ， 与 
所 有 设计 良好 的 程序 一 样 ， 返 回 0 表示 成 功 (例如 ， 选 择 yes 选 项 ) ， 
返回 1 表示 失败 。 

所 有 的 对 话 框 类 型 都 有 各 种 各 样 的 用 于 控制 的 参数 ， 比 如 控制 显 
示 的 对 话 框 的 大 小 和 形状 。 我 们 首先 列 出 每 种 类 型 需要 的 参数 ( 见 表 
2-23) ， 然 后 在 命令 行 上 演示 其 中 一 部 分 参数 的 用 法 。 最 后 ， 你 将 看 
到 一 个 简单 的 将 几 种 对 话 框 结合 起 来 的 程序 。 


表 2-23 


除 此 之 外 ， 所 有 的 对 话 框 类 型 都 有 几 个 相同 的 参数 选项 。 在 此 我 
们 不 一 一 列 出 ， 只 介绍 两 个 选项 : --titte 和 -clear。 前 者 用 于 指定 对 话 框 
的 标题 ， 后 者 用 来 完成 清 屏 操作 。 完 整 的 选项 列表 请 查询 手册 页 。 


x 验 使 用 dialog 工 具 

让 我 们 直接 跳 到 一 个 很 复杂 的 例子 。 一 旦 你 理解 了 这 个 例子 ， 所 
有 其 他 的 程序 束 非 常 答 单 了 1! 在 这 个 例子 中 ， 你 将 创建 一 个 标题 为 
Check me 的 复 选 枉 ， 它 包括 一 条 提示 信息 Pick Numbers。 复 选 框 高 15 
字符 ， 宽 25 字 符 ， 每 个 选项 高 3 个 字符 。 最 后 ， 你 列 出 要 显示 的 选项 并 
设置 了 默认 的 开关 选择 。 


he PNA a 
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图 2-4 显 示 了 该 命令 执行 的 结果 。 

实验 解析 

在 本 例 中 ，--checklist 参 数 用 于 创建 一 个 复 选 枉 。--title 选 项 将 标题 
设置 为 Check me， 下 一 个 参数 是 提示 信息 Pick Numbers. 

你 接 下 来 设置 对 话 框 的 大 小 。 它 高 15 行 ， 宽 25 个 字符 ，3 行 被 用 于 
菜单 。 这 个 大 小 并 不 是 最 合适 的 ， 但 是 你 可 以 从 中 看 到 内 容 的 排列 方 


sts 
3: DOANE eae LAG RF, IRAE TRAIN 
| 口 “ 编 号 ; 
口 XN 
Oo 状态 。 


第 一 个 染 单 项 的 编号 是 1， 显 示 的 文本 是 one， 状 态 设 置 为 of * 58 
二 个 菜单 项 的 值 分 别 是 2、two 和 选中 。 依 次 继续 直到 采 单 项 设置 完 
EE o 


+ 


征 不 是 很 容易 ? 你 可 以 在 命令 行 上 壬 斌 一下， 看 看 它 的 使 用 有 多 
么 简单 。 为 了 能 将 这 些 放 在 一 个 程序 中 ， 你 需要 能 够 访问 用 户 输入 的 
结 末 。 这 一 点 很 容易 实现 ， 对 于 文本 输入 ， 你 只 需要 重 定 问 标准 错误 
人 WAR, F? 的 值 实际 上 就 是 前 一 个 命令 的 退 


X Uy: 一 个 更 复杂 的 使 用 dialog 工 具 的 程序 
a ee 它 关 注 用 户 的 啊 应 : 
(1) 首先 ， 该 程序 通过 显示 一 个 简单 的 对 话 框 来 告 诉 用 户 发 生 的 
i o PEKDE EEUE PIRA 所 以 这 看 起 来 非常 简 
H : 


# Ask zome questions and 


dialog --t 


ese 然后 用 一 -个 简单 的 yesjno 对 话 本 来 询问 用 户 是 否 + 要 继续 操 
作 。 我 们 用 环境 变量 圣 ? 来 检查 用 户 是 否 选择 了 yes 〈 返 回 码 是 0) e 
如 果 用 户 不 想 继续 操作 ， 职 使 用 一 个 简单 的 信息 框 显 示 信 息 ， 信 息 框 
在 退出 之 前 不 需要 用 户 的 输入 。 


ie 'Confizw 
ther 
nfcbox *'Thank you anyway* 5 2 


(3 ) 我 们 使 用 一 个 输入 框 来 询问 用 户 的 姓名 。 重 定 向 标准 错误 流 
25801 Mim txt, ， 然 后 再 将 EMELE RQ NAME: 


(à 现在 显示 一 个 菜单 已 有 4 个 个 同 罗 选项 。 。 你 再 次 重 定向 标 
pul ARUM CU 


15 用 户 选 择 的 菜单 项 编号 将 被 保存 到 临时 文件 工 txt 中 ， 同 时 
人 E at 以 便 你 对 结果 进行 测试 : 


issical" 


(6) 最后， 清除 对 话 框 并 退出 程序 : 


sleep 2 
dialog --clear 
exit 0 
图 2-5 显 示 了 屏幕 上 的 输出 信息 。 
实验 解析 


本 例 通 过 将 dialog 命 令 和 一 些 简单 的 shel 编 程 语句 相 结合 ， 讲 解 了 
如 何 仅仅 使 用 shell 脚 本 来 构建 简单 的 GUI 程序 。 程 序 从 一 个 简单 的 欢 
迎 页 面 开 始 ， 然 后 使 用 一 个 简单 的 --yesno 对 话 框 询问 用 户 十 否 愿 意 继 
续 操 作 。 程 序 使 用 变量 $? 来 检查 用 户 的 回答 。 如 采用 户 同 意 ， 程 序 将 
获得 用 户 的 姓名 并 将 它 保 存在 变量 Q_NAME 中 ， 然 后 使 用 --menu 对 话 
框 询问 用 户 喜 欢 哪 种 类 型 的 音乐 。 通 过 将 用 户 选 择 的 全 单 项 编号 保存 
到 变量 Q_MUSIC 中 ， 程 序 可 以 看 到 用 户 的 回答 并 给 出 适当 的 回应 。 


如 果 你 运行 的 是 一 个 基于 GNOME 的 GUI， 并 且 正 在 使 用 它 提 供 的 
终端 会 话 ， 你 允 可 以 使 用 gdialog 命 令 来 代 蔡 dialog。 这 两 个 命令 有 着 相 
同 的 参数 ， 因 此 你 只 需 将 调用 的 命令 从 dialog 改 为 gdialog 即 可 ， 其 他 的 
代码 完全 不 需 改动 。 图 2-6 显 示 了 在 Ubuntu 系统 中 ， 使 用 上 面 脚本 程序 
的 gdialog 版 本 时 ， 屏 幕 的 输出 结 末 。 


a rickipubuntu-HNS5 L: —-/bipse/chapuz 


Ble Ede view Terminal Tabs Help 
rickfUbuntu RN£1:-/blpic/chap92$ ./gquottiont 
rick@Ubuntu RNS1:-/bipác/chop82$ ./gquestions 


ORF Wao vine bie he 


* Rick, what music do you like bost? 


1 Classical 
2 jaz 
3 
4 


Country 
Othar 


PII ea | 


这 是 从 一 个 脚本 程序 中 生成 可 用 的 GUI 界面 的 非常 简单 的 方法 。 
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至 此 ， 你 已 学 习 完 作为 程序 设计 语言 的 shell 的 主要 功能 。 是 时 候 
运用 你 所 学 的 知识 来 编写 一 个 实际 的 示例 程序 了 。 

仙 罕 全书 ， 你 将 编写 一 个 CD 数据 库 应 用 程序 ， 从 而 更 好 地 掌握 所 
学 的 知识 。 首 和 完 从 shell 脚 本 开始 ， 但 很 快 你 束 会 用 C 语 言 重 写 该 程 
序 ， 并 给 它 加 上 数据 库 等 新 功能 。 


2.8.1 需求 


假设 你 收集 了 大 量 的 CD 唱片 ， 现 在 为 了 方便 管理 ， 你 将 设计 和 实 
现 一 个 管理 CD 唱片 的 程序 。 在 学 习 Linux 程 序 设 计 的 过 程 中 ， 实 现 这 
样 一 个 电子 CD 唱片 目 永 看 起 来 是 一 个 比较 理想 的 项 目 。 

开始 阶段 ， 你 至 少 应 该 能 够 做 到 把 每 张 CD 唱片 的 基本 资料 保存 起 
来 ， 如 唱片 的 名 称 、 音 乐 类 型 、 忆 术 家 或 作曲 家 的 名 字 等 。 你 可 能 还 
想 再 保存 一 些 简单 的 曲目 信息 。 你 希望 能 够 以 每 张 CD 唱 片 为 单位 进行 
搜索 ， 而 不 是 以 曲目 资料 为 单位 。 为 了 让 这 个 小 小 的 应 用 程序 比较 完 
A 你 还 希望 能 够 在 这 个 应 用 程序 中 对 唱片 资料 进行 输入 、 更 新 和 删 


2.82 ”设计 


3 项 需求 (对 数据 进行 更 新 、 检 索 和 显示 ) 应 该 采用 一 个 简单 的 染 
单 束 足 够 了 。 由 于 所 有 需要 存储 的 数据 全 部 都 是 文本 ， 而 且 假 设 你 收 
集 的 CD 唱片 不 是 很 多 ， 因 此 你 就 没有 必要 使 用 一 个 复杂 的 数据 库 ， 使 
用 一 些 简 单 的 文本 文件 即 可 。 将 资料 保存 在 文本 文件 中 将 使 应 用 程序 
比较 简单 ， 而 且 如 果 你 的 需求 发 生 了 变化 ， 操 纵 文 本 文件 总 是 要 比 操 
纵 其 他 类 型 的 文件 更 加 容易 。 在 万 不 得 已 的 情况 下 ， 你 甚至 还 可 以 使 
a 而 不 必 非 要 通过 编写 程序 来 完 


x 


你 需要 为 数据 存储 作出 一 个 重要 的 设计 决策 : 一 个 文件 够 用 吗 ? 
如 有 果 够 用 ， 它 应 该 采用 什么 样 的 格式 ? 除 曲目 信息 以 外 ， 你 想 要 保存 
的 大 部 分 资料 在 每 张 CD 唱 片上 只 出 现 一 次 (我 们 暂 不 考虑 某 些 CD 唱 
片 包含 多 位 作曲 家 或 乏术 家 作品 的 情况 ) ， 而 且 几 乎 所 有 CD 唱片 都 有 


ATEH” 


你 需要 对 可 以 存储 在 CD 唱片 上 的 曲目 数量 加 一 个 限制 吗 ? 这 看 起 
ee 

| 

如 采 对 曲目 数量 没有 限制 ， 你 束 有 以 下 3 种 选择 。 

Oo 只 使 用 一 个 文件 ， 用 一 行 来 保存 “标题 ”信息 ， 再 用 《 行 保存 该 

CD 唱片 上 的 曲目 信息 。 

O 将 每 张 CD 唱 片 的 所 有 信息 都 放置 在 一 行 上 ， 人 允许 该 行 一 直 延 

续 直 到 没有 曲目 信息 需要 保存 为 止 。 

O 把 标题 信息 和 曲目 信息 分 开 ， 用 不 同 的 文件 来 分 别 保存 它 


们 。 

只 有 第 三 种 做 法 能 够 让 你 灵活 地 修改 文件 的 格式 ， 如 果 今 后 你 想 
把 数据 库 转 换 为 天 系数 据 库 格 式 的 话 (将 在 第 7 章 详 细 介 绍 ) ， 你 就 需 
要 修改 文件 格式 ， 因 此 我 们 选择 第 三 种 方法 。 

下 一 个 决策 是 要 在 文件 里 放 入 哪些 信息 。 

我 们 决定 对 每 张 CD 唱 片 你 存 以 下 信息 : 

口 CD 唱片 的 目录 编号 ; 

LJ 标题 ; 

口 曲目 类 型 GEER. PRR UT. BRL ; 

O 作曲 家 或 艺术 家 。 

对 曲目 ， 我 们 只 保存 两 条 信息 : 

L] 曲目 编号 ; 

o 曲名 。 

为 了 把 这 两 个 文件 结合 起 来 ， 你 必须 把 曲目 信息 和 CD 唱片 上 的 其 
他 信息 关联 起 来 。 为 此 ， 你 需要 使 用 CD 唱片 的 目录 编号 。 因 为 它 对 每 
张 CD 唱 片 都 是 唯一 的 ， 所 以 它 在 标题 文件 中 只 出 现 一 次 ， 在 曲目 文件 
中 对 每 首 曲目 也 只 出 现 一 次 。 

让 我 们 来 看 一 个 示例 标题 文件 ， 如 表 2-24 所 示 。 


表 2-24 


Baar iz n RHES tex — 


它 所 对 应 的 曲目 文件 ， 如 表 2-25 所 示 。 
X 2-25 


CD343 Dsery 


这 两 个 文件 通过 目录 编号 结合 在 一 起 。 请 记 住 ， 标 题 文 件 中 的 一 
个 数据 项 一 般 都 对 应 曲目 文件 中 的 多 行 数据 。 

你 需要 决定 的 最 后 一 件 事情 是 如 何 分 隔 数据 项 。 在 关系 数据 库 
里 ， 长 度 固 定 的 数据 字段 比较 常见 ， 但 它 并 非 总 是 最 方便 的 。 另 一 种 
常见 方法 是 使 用 逗号， 这 个 例子 就 选择 了 这 个 方法 ( 即 用 逗号 分 隔 变 
量 ， 或 CSV 文 件 ) . 

在 接 下 来 的 “实验 ”部 分 ， 为 了 不 至 于 让 你 迷失 方向 ， 我 们 把 将 要 
用 到 的 函数 列 在 下 面 : 


get_return | 


get nfirm 
set nu 
ins „titl 
insert trac) 
add record t k 
add recordsi 
find, _cdt) 
update cd( 
ount cds 
remove rec 
list rrack 


X 验 CD 唱片 应 用 程序 
(1) 和 以 前 一 样 ， 这 个 示例 脚本 程序 的 第 一 行 用 于 确保 自己 可 以 
作为 一 个 shell 脚 本 程序 来 执行 ， 接 下 来 是 一 些 版 权 信息 : 


ery -r| 
py ht 
This gram is free software; you can redistribute it and/or modify it 
moe n 
Fro ftw 
pti 1 
pti 
This progr 
WITH AN) 
MERCH TAB 
Publ ic 
u 
sth this program Í not, write to the Free ftwa 
4 675 M 


(2) 首 移 要 做 的 事情 就 是 ， 确 保 设 置 好 脚本 程序 将 要 用 到 的 一 些 
全 局 变量 ， 包 括 标题 文件 、 曲 目 文件 和 一 个 临时 文件 。 我 们 还 设置 
中 断 处 理 ， 以 确保 在 用 户 中 断 脚本 程序 时 删除 临时 文 


(3) 现在 开始 定义 函数 。 因 为 脚本 程序 是 从 文件 的 第 一 行 开 始 执 
行 ， 所 以 这 样 做 可 以 确保 在 调用 任何 一 个 函数 之 前 都 能 够 找到 它 的 定 
义 。 为 了 避免 在 几 个 地 方 反 复 编写 同样 的 代码 ， 节 开始 的 两 个 函数 是 
人 简单 的 工具 型 画 数 : 


(4) 接 下 来 是 主 菜 单 函 数 set_menu_choice。 菜 单 的 内 容 是 动态 变 
化 的 ， 当 用 户 选 择 了 某 张 CD 唱片 后 ， 主 荣 单 中 会 多 出 几 个 选项 。 


注意 ，echo-e 命 令 可 能 不 能 被 移植 到 某 些 shell 中 。 


(5) 接 下 来 是 两 个 很 短小 的 函数 insert_title 和 insert track， 它 们 用 
于 辣 数 据 库 文件 里 添加 数据 。 虽 然 有 的 人 不 喜欢 这 种 长 上 度 只 有 一 行 的 
函数 ， 但 它们 有 助 于 让 其 他 函数 的 含义 更 清晰 易 解 。 
紧 跟 着 这 两 个 函数 的 是 一 个 比较 大 的 函数 add_record_tracks， 它 会 
用 到 上 述 两 个 短小 的 函数 。 这 个 函数 使 用 模式 匹配 来 确保 用 户 未 输入 
有 逗号 〈 因 为 我 们 把 逗号 用 做 数据 字段 之 间 的 分 隅 符 ) ， 使 用 算术 操作 
在 用 户 输入 曲目 时 递增 当前 曲目 的 编号 : 


(6) add_records 函 数 用 于 输入 新 CD 唱片 的 标题 信息 : 


reac ug 


(7) find_cdER AXA E FH Zé fi FH grep TE CDIB Hr tre PE E 

找 CD 唱 片 的 有 关 资 料 。 你 需要 知道 查询 字符 串 在 标题 文件 里 出 现 的 次 
数 ， 但 grep 命 令 的 返回 值 只 能 告诉 你 该 字符 串 是 匹配 了 0 次 还 是 多 次 。 
为 了 解决 这 一 问题 ， 我 们 把 grep 命 令 的 输出 保存 到 一 个 临时 文件 中 ， 
文件 中 的 每 行 对 应 一 次 匹配 ， 然 后 再 统计 该 文件 的 行 数 。 

单词 统计 命令 wc 在 其 输出 中 使 用 空格 符 分 隅 被 统计 文件 中 的 行 
数 、 单 词 数 和 字符 个 数 。 我 们 使 用 $ (we-1 $temp_file) 标记 从 wc 命令 
的 输出 结果 中 提取 出 第 一 个 参数 ， 并 赋值 给 变量 linesfound。 如 果 要 用 
到 wc 命 令 输 出 中 的 其 他 参数 ， 你 可 以 利用 set 命 令 把 shell 参 数 变 量 设 置 
为 wc 命令 的 输出 结果 。 P 

我 们 把 IFS (内 部 数据 字段 分 隔 符 ) 设置 为 一 个 逗号 ， 这 样 你 就 可 
以 读 取 以 运 号 分 隔 的 数据 字段 了 。 另 一 个 可 选择 的 命令 是 cut。 


(8) update cdH FH F eT ACDIB RHAH o TER, (ete 
搜索 (使 用 grep) 的 行 征 以 $cdcatnum 开 头 (通过 标志 ^) 并 且 其 后 跟 
着 一 MES, AL OR is RHE Y cdcatnum t AD RE —Ó8] 4618 7 0) 
里 ， 这 样 你 就 可 以 搜索 紧 跟 在 CD 目录 编号 之 后 的 逗号 了 。 这 个 函数 还 


在 get_confirm 返 回 true 的 情况 下 ， 用 花 括 号 将 要 执行 的 多 个 语句 组 成 一 
个 语句 块 。 


" (9) count_cds 函 数 用 于 快速 统计 数据 库 中 CD 唱片 个 数 和 曲目 总 
BM: 


(10) remove records iK ži FH FARCIE E F FREE, E 
通过 grep -vi 命令 删除 所 有 匹配 的 字符 串 。 注 意 ， 你 必须 使 用 一 个 临时 
文件 来 完成 这 一 工作 。 

Ed DIE 命令 : 
ra "fle SCE BR-2tegrep at 2 THBBUG 2 AL. 1559) EH EE TH] PR FE CR 
为 空 文件 ， 结 果 导 致 grep 命 令 将 从 一 个 至 文件 里 读 取 数 据 。 


(11) list_tracks 函 数 还 是 使 用 grep 命 令 来 找 出 你 想 要 的 行 ， 它 通 
过 cut 命 令 来 访问 你 想 要 的 字段 ， 然 后 通过 more 命 令 提 供 按 页 输出 。 如 
果 你 对 比 一 下 用 C 语 言 重新 实现 这 段 大 约 20 行 左右 的 代码 需要 多 少 条 
语句 的 话 ， 你 就 不 得 不 佩服 shell 是 一 个 功能 多 么 强大 的 工具 了 。 


(12) ”现在 所 有 的 函数 都 已 定义 好 了 ， 你 可 以 进入 主 程序 部 分 
了 。 开 头 的 几 行 先 确保 需要 的 文件 处 于 一 个 已 知 状态 ， 然 后 调用 主 采 
单 函 数 set menu_choice， 再 根据 它 的 输出 进行 相应 的 操作 。 
A, 


RAPE Rh, JET etc GRACE, Naa fe 
最 后 成 功 退 出 “退出 码 为 0) : 


2.83 ”应 用 程序 的 说 昌 


脚本 程序 开始 处 的 trap 命 令 用 于 设置 在 用 户 按 下 Ctrl+C 组 合 键 时 的 
中 断 处 理 。 根 据 终端 设置 的 不 同 ，Ctl+C 组 合 键 可 能 引发 EXIT 或 INT 


实现 染 单 选择 还 有 其 他 的 办 法 ， 特 别 值得 一 提 的 是 bash 或 ksh 提 供 
的 select 结 构 (但 它 示 被 列 在 X/Open 规范 中 ) 。 它 是 一 个 专门 用 来 处 理 
菜单 选择 的 结构 。 如 果 你 并 不 介意 脚本 程序 移植 性 稍 差 的 话 ， 可 以 孝 
虚 使 用 它 。 你 还 可 以 利用 here 文 档 来 实现 为 用 户 提 供 多 行 信息 。 

你 可 能 已 注意 到 ， 当 添加 一 个 新 的 CD 唱片 记录 时 ， 程 序 并 没有 检 
碍 其 主键 。 新 代码 只 是 忽略 使 用 同样 主键 的 后 续 唱 片 标题 ， 但 把 它们 
的 曲目 添加 到 第 一 个 使 用 该 主键 的 CD 唱片 的 曲目 清单 中 。 如 下 所 示 : 

1 First CD Track 1 

2 First CD Track 2 


1 Another CD 

2 With the same CD key 

我 们 将 把 这 个 问题 及 其 他 改进 留 给 读者 ， 请 充分 发 挥 你 们 的 想象 
力 和 创造 力 ， 因 为 你 可 以 在 GPL 条 款 之 下 任意 修改 这 些 代码 。 


29 小结 


在 本 章 中 ， 你 已 看 到 shell 本 身 束 是 一 种 功能 强大 的 程序 设计 语 
言 。 它 能 够 轻松 调用 其 他 程序 并 对 它们 的 输出 进行 处 理 ， 这 种 能 力 使 
得 shell 成 为 完成 文本 和 文件 处 理 任务 的 一 个 理想 工具 。 

当 你 下 一 次 需要 一 个 小 工具 程序 时 ， 请 考虑 一 下 你 是否 可 以 通过 
将 一 些 Linux 命 令 组 合 进 一 个 shell 脚 本 程序 来 解决 目 己 的 问题 。 你 会 惊 
| 使 用 shell 束 可 以 编写 出 大 量 的 
LEGE ° 


第 3 章 文件 操作 


Erap, 你 将 了 解 Linux 中 的 文件 、 目 隶 以 及 相关 操作 。 你 将 
学 习 如 何 创 建 、 打 开 、 读 写 和 关闭 文件 ， 还 将 学 习 程 序 是 如 何 处 理 日 
录 的 (例如 创建 、 扫 描 和 删除 目录 ) 。 在 上 一 章 我 们 讨论 了 shell 之 
后 ， 现 在 ， 你 将 开始 用 C 语 言 进行 编程 了 。 

在 开始 讨论 Linux 对 文件 IO 的 处 理 方 法 之 前 ， 我 们 先 回 顾 一 下 与 
文件 、 目 录 和 设备 相关 的 概念 。 为 了 对 文件 和 目录 进行 处 理 ， 你 需要 
用 到 系统 调用 (这 是 UNIX 和 Linux 中 与 Windows API 对 应 的 概念 ) ， 
但 系统 中 同时 还 存在 一 整套 库 函 数 标准 MO 库 (stdio) ， 可 以 更 有 
效 地 进行 文件 处 理 。 

在 本 章 的 大 部 分 内 容 中 ， 我 们 将 详细 讨论 处 理 文件 和 目录 的 各 种 
调用 。 因 此 ， 本 章 将 涵盖 如 下 各 种 与 文件 相关 的 主题 : 
文件 和 设备 
系统 调用 
库 函 数 
底层 文件 访问 
管理 文件 
标准 IO 库 
格式 化 输入 和 输出 
文件 和 目录 的 维护 
Hii Hx 

彰 误 及 其 处 理 
/proc 文 件 系统 
高 级 主题 : fant1 和 mmap 


口 口 口 口 口 口 口 口 口 口 口 口 


3.1 Linux 结 


你 可 能 会 问 ;“ 为 什么 要 在 这 里 讨论 文件 结构 呢 ? 我 早 知道 它 
了 。” 这 么 说 吧 ， 与 UNIX 一 样 ，Linux 环 境 中 的 文件 具有 特别 重要 的 意 
义 ， 因 为 它们 为 操作 系统 服务 和 设备 提供 了 一 个 简单 而 一 致 鸭 接口 。 
在 Linux 中 ， 一 切 (或 几乎 一 切 ) 都 是 文件 。 

这 就 意味 着 ， 通 党 程序 完全 可 以 像 使 用 文件 那样 使 用 磁盘 文件 、 
PITO ` 打印机 和 其 他 设备 。 在 本 书后 面 的 内 容 中 ， 我 们 将 介绍 一 些 
例外 情况 ， 比 如 第 15 章 中 的 网 络 连接 。 但 大 多 数 情 况 下 ， 你 只 需要 使 
用 5 个 基本 的 函数 open ` close ` read ^ write#lioctl ° 

目录 也 是 文件 ， 但 它 是 一 种 特殊 类 型 的 文件 。 在 现代 的 UNIX (8) 
括 Linux) 版 本 中 ， 即 使 是 超级 用 户 可 能 也 不 再 被 允许 直接 对 目录 进行 
写 操 作 了 。 上 所 有 用 户 通常 都 使 用 上 层 的 opendirvreaddir 接 口 来 读 取 目 
录 ， 而 无 需 了 解 特定 系统 中 目录 实现 的 具体 细节 。 我 们 将 在 本 章 的 后 
面 介 绍 专门 的 目录 函数 。 

可 以 这 么 说 ，Linux 中 的 任何 事物 都 可 以 用 一 个 文件 来 表示 ， 或 者 
通过 特殊 的 文件 提供 。 虽 然 它们 会 与 你 熟悉 的 传统 文件 有 一 些 细 微 的 
区 别 ， 但 两 者 的 基本 原理 是 一 致 的 。 下 面 就 让 我 们 来 看 看 到 目前 为 止 
我 们 提 到 的 一 些 特殊 文件 。 


3.1.1 目录 


文件 ， 除 了 本 身 包含 的 内 容 以 外 ， 它 还 会 有 一 个 名 字 和 一 些 属 
性 ， 即 “管理 信息 ”， 包 括 文件 的 创建 /修改 日 期 和 它 的 访问 权限 。 这 些 
属性 被 保存 在 文件 的 inode (节点 ) 中 ， 它 是 文件 系统 中 的 一 个 特殊 的 
数据 块 ， 它 同时 还 包含 文件 的 长 度 和 文件 在 磁 副 上 的 存放 位 置 。 系 统 
We 

目录 是 用 于 保存 其 他 文件 的 节点 号 和 名 字 的 文件 。 目 录 文 件 中 的 
每 个 数据 项 都 是 指向 某 个 文件 让 点 的 链接 ， 删 除 文 件 名 束 等 于 删除 与 
之 对 应 的 链接 (文件 的 六 点 号 可 以 通过 In-i 命 令 查 看 ) 。 你 可 以 通过 使 
用 In 命令 在 不 同 的 目录 中 创建 指 癌 同一 个 文件 的 链接 。 

删除 一 个 文件 时 ， 实 质 上 十 删除 了 该 文件 对 应 的 目 永 项 ， 同 时 指 
回 该 文件 的 链接 数 减 1。 该 文件 中 的 数据 可 能 仍然 能 够 通过 其 他 指 回 同 
一 文件 的 链接 访问 到 。 如 有 果 指 癌 某 个 文件 的 链接 数 (CBMs -1 命令 的 输 


出 中 跟 在 访问 权限 后 面 的 那个 数字 ) 变 为 零 ， 就 表示 该 节点 以 及 其 指 
回 的 数据 不 再 被 使 用 ， 磁 盘 上 的 相应 位 置 就 会 被 标记 为 可 用 空间 。 

文件 被 安排 在 目录 中 ， 目 录 中 可 能 还 包含 子 日 录 。 这 些 构 成 了 我 
们 所 熟悉 的 文件 系统 层次 结构 。 用 户 (比如 neil) 通常 会 将 自己 的 文件 
保存 在 家 目 孙 中 ， 这 可 能 是 目 孙 /homemeil， 该 目 孙 还 将 包含 用 于 保存 
电子 邮件 、 商 业 信函 、 工 具 程序 等 的 子 目 永 。 注 意 ， 许 多 UNIX 和 
Linux 的 shell 都 介 许 用 户 通 过 波浪 线 符号 (~) 直接 进入 自己 的 家 日 
录 。 要 想 进 入 他 人 的 家 上 日 录 ， 就 键入 ~user (~ 加 用 户 名 ) 即 可 。 如 你 
所 知 ， 每 个 用 户 的 家 目录 通常 是 一 个 上 层 目 录 的 子 目录 ， 这 个 上 层 目 
了 永 是 专 为 此 有 目的 而 创建 的 ， 在 本 例 中 ， 它 就 是 home 目录 。 


注意 ， 粳 薰 的 是 ， 标 准 库 函 数 不 能 理解 文件 名 参数 中 的 shell 
ee 所 以 你 必须 始终 在 目 己 的 程序 中 使 用 真实 的 文 


home H KEH X iR A/T FAS, PRA ROTA RE 
的 最 顶端 ， 它 在 它 的 各 级 子 目 录 中 包含 着 系统 中 的 所 有 文件 。 根 目 隶 
中 通常 包含 用 于 存放 系统 程序 (二进制 可 执行 文件 ) 的 /bin 子 目录 、 
用 于 存放 系统 配置 文件 的 /etc 子 目 永 和 用 于 存放 系统 函数 库 的 /lib 子 目 
孙 。 代 表 物 理 设 备 并 为 这 些 设备 提供 接口 的 文件 按照 惯例 会 被 放 
在 /dev 子 目录 中 。 图 3-1 显 示 了 一 个 典型 的 Linux 目 隶 结构 的 一 部 分 。 天 
uL COUSINS IUS 中 有 关 Linux 文 件 系统 标 
准 的 讨论 。 


di 


bin dev home 


neil rick 


Ag [oo 


mail letters programs 


` 


3.1.2 


甚至 硬件 设备 在 Linux 中 通常 也 被 表示 (映射) 为 文件 。 例 如 ， 作 
ERO ee 


* mount -t iso9660 /dev/hdéc /mnt/cdrom 
! cd /mnt/cdrom 


这 个 命令 将 CD-ROM 设 备 (在 本 例 中 ， 是 在 系统 启动 时 被 装载 

为 /dev/hdc 的 第 二 个 主 IDE 设 备 ， 其 他 类 型 的 设备 对 应 不 同 的 /dev 条 
目 ) 中 的 当前 内 容 挂 载 为 /mntcdrom 目 录 下 的 文件 结构 。 然 后 ， 你 就 

iR 样 浏览 CD-ROM 的 日 录 ， 只 不 过 该 日 录 中 的 内 容 是 只 读 


UNIX 和 Linux 中 比较 重要 的 设备 文件 有 3 个 : /dev/console ` /dev/tty 
和 /devnull ° 

1. /dev/console 

NM GUN EIU ane 错误 信息 和 诊断 信息 通常 会 被 发 
送 到 这 个 设备 。 每 个 UNIX 系 统 都 会 有 一 个 指定 的 终端 或 显示 屏 用 来 接 
收 控制 台 消息 。 过 去 ， 台 专 用 的 打印 终端 。 在 现代 的 工作 


站 和 Linux 上， 它 通 常 古 “活路 ”的 虚拟 控制 台 ; 而 在 X 视 窗 系 统 中 ， 它 
会 是 屏 医 上 一 个 特殊 的 控制 台 窗 口 。 

2./dev/tty 

WFR — TERE A PE AmA, AARRE /dew/tty Bt Ee XX NE 
制 终 端 BEAL ALAR BE, CRRA BO) 的 别名 (逻辑 设备 ) 。 例 
2 , HARA OSTA WS fim. Are IT SET 

/dev/tty ° 

在 能 够 使 用 该 设备 文件 的 情况 下 ，/dewtty 人 允许 程序 直接 向 用 户 输 
出 信息 ， 而 不 管用 户 具体 使 用 的 是 哪 种 类 型 的 伪 终 端 或 硬件 终 并 。 在 
标准 输出 被 重 定 癌 时 ， 这 一 功能 非常 有 用 。 使 用 命令 ls -R Imore 显 示 
一 个 长 目录 列表 就 是 一 个 这 样 的 例子 ，more 程 序 需 要 提示 用 户 进行 刍 
盘 操 作 之 后 才能 显示 下 一 页 内 容 。 你 将 在 第 5 章 中 看 到 更 多 使 
用 /dev/tty 的 例子 。 

注意 ， 虽 然 /dev/console 设 备 只 有 一 个 ， 但 通过 /dev/tty 却 能 够 访问 
许多 不 同 的 物理 设备 。 

3./dev/null 

/dev/null 文 件 是 空 (null) 设备 。 所 有 写 向 这 个 设备 的 输出 都 将 被 
丢弃 ， 而 读 这 个 设备 会 立刻 返回 一 个 文件 尾 标志 ， 所 以 在 cp 命令 里 可 
ee eae 。 人 们 常 把 不 需要 的 输出 重 定 向 

/dev/null ° 


创建 空 文件 的 男 一 个 方法 是 使 用 touch <filename> 命 令 ， 该 命 


令 的 作用 是 改变 文件 的 修改 时 间 。 如 有 果 指 定 的 文件 不 存在 ， 殉 创 
建 它 ， 但 该 命令 并 不 会 把 有 内 容 的 文件 变 成 空 文 件 。 


S echo do not want to see this >/dev/null 
$ cp /dev/null empty file 


/dev 日 录 中 的 其 他 设备 包括 : PERE iO. fs X] 
如 、CD-ROM、 疡 卡 以 及 一 些 代表 系统 内 部 工作 状态 的 设备 。 该 目录 
中 甚至 还 有 /dewzero 设 备 ， 它 可 以 作为 创建 空 文件 的 null 字 和 源 。 访 问 
该 目录 中 的 某 些 设备 需要 具有 超级 用 户 权 限 ， 普 通用 户 不 能 通过 编写 
程序 来 直接 访问 如 人 硬盘 这 样 的 底层 设备 。 设 备 文件 的 名 字 会 随 系 统 的 
不 同 而 不 同 。Linux 发 行 版 通常 都 提供 了 以 超级 用 户 身 份 运行 的 应 用 程 
序 ， 用 来 管理 那些 以 其 他 用 户 喘 份 无 法 访问 的 设备 ， 例 如 ， 用 于 挂 载 
文件 系统 的 mount 命 令 。 


设备 被 分 为 字符 设备 和 块 设备 。 两 者 区 别 在 于 访问 设备 时 是 否 需 
要 一 次 读 写 一 整 块 。 一 般 情 况 下 ， 块 设备 是 那些 文 持 某 些 类 型 文件 系 
统 的 设备 ， 例 如 硬盘 。 

在 本 章 中 ， 我 们 将 集中 讨论 磁盘 文件 和 目 孙 。 我 们 将 在 第 5 章 中 讨 
论 另 一 种 设备 一 一 用 户 终端 。 


UR Ae FAR ZD SY ER DU P] AA A eB EFT I AP HH] 9 3K 

函数 被 称 为 系统 调用 ， 由 UNIX (和 Linux) 直接 提供 ， 它 们 也 是 通 
A RR tae He 

操作 系统 的 核心 部 分 ， 即 内 核 ， 是 一 组 设备 驱动 程序 。 它 们 是 一 
组 对 系 统 硬件 进行 控制 的 底层 接口 。 ° 例如 ， 磁 市 机 就 有 一 个 与 之 对 应 
的 设备 驱动 程序 ， 它 知道 如 何 启 动 磁 带 、 如 何 对 它 前 后 回 绕 、 如 何 对 
它 进行 读 写 等 。 它 还 知道 磁带 必须 以 固定 长 度 的 数据 块 为 单位 进行 读 
写 。 因 为 位 市 在 实质 上 是 一 个 顺序 存 取 设 备 ， 所 以 驱动 程序 并 不 能 和 直 
ee 而 是 必须 先 把 它 回 绕 到 正确 的 位 置 。 

了 向 用 户 提 供 一 个 一 致 的 接口 ， 设 备 驱 动 程序 封装 了 所 有 与 硬 

件 相 关 的 特性 。 硬件 的 特有 功能 通常 可 通过 ioctl (FA FLOR) 系统 
调用 来 提供 。 

/dev 日 录 中 的 设备 文件 的 用 法 都 是 相同 的 ， 它 们 都 可 以 被 打开 、 
读 、 写 和 关闭 。 例 如 ， 用 来 访问 普通 文件 的 open 调 用 同样 可 以 用 来 访 
问 用 户 终 端 、 打 印 机 或 磁带 机 © 

下 面 是 用 于 访问 设备 驱动 程序 的 底层 函数 (系统 调用 ) 。 

o open: 打开 文件 或 设备 。 

口 read: 从 打开 的 文件 或 设备 里 读数 据 。 

O write: 癌 文 件 或 设备 写 数 据 。 

close: 关闭 文件 或 设备 。 

ioctl: 把 控制 信息 传递 给 设备 驱动 程序 。 

系统 调用 iocu 用 于 提供 一 些 与 特定 硬件 设备 有 关 的 必要 控制 (5 
正常 的 输入 输出 相反 ) ， 所 以 它 的 用 法 随 设备 的 不 同 而 不 同 。 例 如 ， 
ioctl Ja] H n] LAA [BIZ ARE LN E ERIT DUET CER E FAK, ioctl 
ANS ale! 可 移植 性 。 此 外 ， 每 个 驱动 程序 都 定义 了 它 目 己 的 一 组 
ioctl 命 令 

这 此 系统 调用 和 其 他 系统 调用 的 文档 一 般 放 在 手册 页 的 第 二 市 
提供 系统 调用 参数 列表 和 返回 类 型 的 雷 数 原型 及 相关 的 yaetite 攻 量 都 
。 每 个 系统 调用 独 有 的 要 求 可 参见 各 个 系统 调用 的 
p o 


3.3 JERN 


针对 输入 输出 操作 直接 使 用 底层 系统 调用 的 一 个 问题 是 它们 的 效 
率 非 常 低 。 为 什么 呢 ? 

O 使 用 系统 调用 会 影响 系统 的 性 能 。 与 画 数 调用 相 比 ， 系 统 调 

用 的 开销 要 大 些 ， 因 为 在 执行 系统 调用 时 ，Linux 必 须 从 运行 用 户 

代码 切换 到 执行 内 核 代 码 ， 然 后 再 返回 用 户 代 码 。 减 少 这 种 开销 

的 一 个 好 方法 是 ， 在 程序 中 尽量 减少 系统 调用 的 次 数 ， 并 且 让 每 

次 系统 调用 完成 尽 可 能 多 的 工作 。 例 如 ， 每 次 读 写 大 量 的 数据 而 

不 是 每 次 仅 读 写 一 个 字符 。 

O 硬件 会 限制 对 底层 系统 调用 一 次 所 能 读 写 的 数据 块 大 小 。 例 

如 ， 人 磁带 机 通常 一 次 能 写 的 数据 块 长 度 是 10k。 所 以 ， 如 有 果 你 试图 

写 的 数据 量 不 是 10k 的 整数 倍 ， 人 磁 市 机 还 是 会 以 10k 为 单位 着 绕 倍 

W, MAMER EA T TERR ° 

为 了 给 设备 和 磁盘 文件 提供 更 高 层 的 接口 ，Linux 发 行 版 《和 
UNIX) 提供 了 一 系列 的 标准 函数 库 。 它 们 是 一 些 由 函数 构成 的 集合 ， 
你 可 以 把 它们 应 用 到 目 己 的 程序 中 ， 比 如 提供 输出 缓冲 功能 的 标准 1/O 
库 。 你 可 以 高 效 地 写 任意 长 度 的 数据 块 ， 库 函数 则 在 数据 满足 数据 块 
E 。 这 束 极 大 降低 了 系统 调用 的 开 


库 函 数 的 文档 一 般 被 放 在 手册 页 的 第 三 站 ， 并 且 库 函数 往往 会 有 
一 个 与 之 对 应 的 标准 头 文件 ， 例 如 与 标准 IO 库 对 应 的 头 文 件 是 
stdio.h ° 

图 3-2 是 对 前 面 几 小 节 讨 论 的 总 结 ， 它 显示 了 Linux 系 统 中 各 种 文 
件 函 数 与 用 户 、 设 备 驱 动 程序 、 内 核 和 硬件 之 间 的 关系 。 


设备 驱动 程序 ; 内核 


BJ "» 


3.4 jj n 


每 个 运行 中 的 程序 被 称 为 进程 (proces) ， 它 有 一 些 与 之 关联 的 
文件 描述 得 。 这 是 一 些小 值 整数 ， 你 可 以 通过 它们 访问 打开 的 文件 或 
设备 。 有 多 少 文 件 描述 符 可 用 取决 于 系统 的 配置 情况 。 当 一 个 程序 开 
台 运 行 时 ， 写 一 般 会 有 3 个 已 经 打开 的 文件 描述 符 : 

O 0: 标准 输入 

口 1: 标准 输出 

O 2: 标准 错误 

你 可 以 通过 系统 调用 open 把 其 他 文件 摘 述 符 与 文件 和 设备 相关 
联 ， 稍 后 讲解 。 其 实 使 用 目 动 打开 的 文件 描述 符 束 已 经 可 以 通过 write 
系统 调用 来 创建 一 些 简 单 的 程序 了 。 


系统 调用 write 的 作用 是 把 缓冲 区 buf 的 前 nbytes 个 字 节 写 入 与 文件 
描述 符 名 des 关 联 的 文件 中 。 它 返回 实际 写 入 的 字 节 数 。 如 果 文 件 描述 
符 有 错 或 者 故 层 的 设备 驱动 程序 对 数据 块 长 度 比 较 敏 感 ， 该 返回 值 可 
能 会 小 于 nbytes。 如 果 这 个 函数 返回 0， 束 表示 未 写 入 任何 数据 ; 如 果 
它 返回 的 是 -1， 束 表示 在 write 调用 中 出 现 了 错误 ， 错 误 代 人 码 保存 在 全 
局 变量 errno 里 。 

下 面 是 write 系统 调用 的 原型 : 


#include <unistd.h> 


size t write(int fildes, const void *buf, size t nbytes); 


有 了 这 些 知 识 ， 你 就 可 以 编写 第 一 个 程序 simple_write.c T : 


Write 


这 个 程序 只 是 在 标准 输出 上 显示 一 条 消 奶 。 当 程序 退出 运行 时 ， 
所 有 已 经 打开 的 文件 描述 符 都 会 目 动 天 闭 ， 所 以 你 不 需要 明确 地 关闭 


它们 。 但 处 理 被 缓冲 的 输出 时 ， 情 况 就 不 一 样 了 。 
$ ./simple write 
Here is some data 


> 


需要 再 次 提醒 的 是 ， a E a 少 。 
这 并 不 一 定 是 个 错误 。 在 程序 中 ， 你 需要 检查 errno 以 发 现 错误 ， 然 后 
再 次 调用 write 写 入 剩余 的 数据 。 


3.4.2 read AZ H 


系统 调用 read 的 作用 是 : 从 与 文件 描述 符 fides 相 关联 的 文件 里 读 
入 nbytes 个 字 节 的 数据 ， 并 把 它们 放 到 数据 区 buf 中 。 它 返回 实际 读 入 
的 字 太 数 ， 这 可 能 会 小 于 请 求 的 字 太 数 。 如 果 read 调 用 返回 9， 束 表示 
未 读 入 任何 数据 ， 已 到 达 了 文件 尾 。 同 样 ， 如 果 返 回 的 是 -1， 职 表示 
read 调 用 出 现 了 错误 © 


#include <unistd.h> 


size_t read(int fildes, void *buf, size t nbytes); 
下 面 这 个 程序 simple_read. c 把 标准 输入 的 前 128 个 字 市 复制 到 标准 
输出 。 A si 束 把 它们 全 体 复制 过 去 。 


Sinclude <unistd 
finclude <stdli idis 


int maini] 


char buffer[128]; 


int nreaed; 
nread = read 9, buf fe 1281; 
if [nreajd == ) 
write(2 "A read error has occurred\n", 26]; 
f Li(write[(l.buffer,nread]) != nread 
write(2, "A write error has cccurred\n*,27); 


exití(0l; 


运行 这 个 程序 ， 你 会 看 到 : 


3 echo hello there | ./simple_read 


there 


$ (simple. reed < drafti.txt 


chapter we will be looking at files and directories and how to manipulate 


第 一 次 运行 程序 时 ， 你 使 用 echo 通 过 管道 为 程序 提供 输入 。 在 第 
二 次 运行 时 ， 你 通过 文件 重 定 癌 输入 。 此 时 ， 你 可 以 看 到 文件 draftl.txt 
的 第 一 部 分 出 现在 了 标准 输出 上 。 


请 注意 ， 下 一 个 shell 提 示 符 出 现在 输出 数据 最 后 一 行 的 尾 
部 ， 因 为 在 这 个 例子 中 ，128 个 字 节 的 数据 并 没有 构成 一 个 完整 的 
行 。 


3.43 ”open 系统 调用 


为 了 创建 一 个 新 的 文件 描述 符 ， 你 需要 使 用 系统 调用 open。 
#include «fcntl.h» 
#include <sys/types.h> 
#include «sys/stat.h» 


int open(const char *path, int oflags); 
int open(const char *path, int oflags, mode_t mode); 


PRR UL, fEXÉJBPOSDONQBHJARZ LE. EH open% AA 
并 不 需要 包括 头 文件 sys/types.h 和 sys/stat.h， 但 在 某 些 UNIX 系 统 
上 上 ， 它 们 可 能 是 必 不 可 少 的 。 


简单 地 说 ，open 建 立 了 一 条 到 文件 或 设备 的 访问 路 径 。 如 果 调 用 
成 功 ， 它 将 返回 一 个 可 以 被 read、write 和 其 他 系统 调用 使 用 的 文件 描 
述 符 。 这 个 文件 描述 符 是 唯一 的 ， 它 不 会 与 任何 其 他 运行 中 的 进程 共 
享 。 如 果 两 个 程序 同时 打开 同一 个 文件 ， 它 们 会 分 别 得 到 两 个 不 同 的 
文件 描述 符 。 如 果 它 们 都 对 文件 进行 写 操 作 ， 那 么 它们 会 各 写 各 的 ， 
它们 分 别 接着 上 次 离开 的 位 置 继续 往 下 写 。 它 们 的 数据 不 会 交织 在 一 
起 ， 而 是 彼此 互相 履 盖 。 两 个 程序 对 文件 的 读 写 位 置 ( 偏 移 值 ) 不 
ni Lo POUND UNIUS fl VRE EB 7E HAT 
绍 该 能 a 

准备 打开 的 文件 或 设备 的 名 字 作 为 参数 path 传 递 给 函数 ，oflags 参 
数 用 于 指定 打开 文件 所 采取 的 动作 。 

oflags 参 数 是 通过 必需 文件 访问 模式 与 其 他 可 选 模式 相 结 合 的 方式 
来 指定 的 。open 调 用 必须 指定 表 3-1 中 所 示 的 文件 访问 模式 之 一 。 
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O O APPEND: 把 写 入 数据 追加 在 文件 的 末尾 。 

O O TRUNC: 把 文件 长 度 设置 为 零 ， 丢 弃 已 有 的 内 容 。 

| za ean 如 果 需 要 ， 就 按 参 数 mode 中 给 出 的 访问 模式 创建 


O O_EXCL: 与 O_CREAT 一 起 使 用 ， 确 你 调用 者 创建 出 文件 。 

Open 调 用 是 一 个 原子 操作 ， 也 就 是 说 ， 它 只 执行 一 个 函数 调用 。 

使 用 这 个 可 选 模式 可 以 防止 两 个 程序 同时 创建 同一 个 文件 。 如 果 

文件 已 经 存在 ，open 调 用 将 失败 。 

其 他 可 以 使 用 的 oflag 值 请 参考 open 调 用 的 手册 页 ， 它 们 出 现在 该 
手册 页 的 第 二 节 (使 用 man 2open 命 令 查看 ) 。 

open 调 用 在 成 功 时 返回 一 个 新 的 文件 描述 符 ( 它 总 是 一 个 非 负 整 
数 ) ， 在 失败 时 返回 -1 并 设置 全 局 变量 ermo 来 指明 失败 的 原因 。 我 们 
将 在 本 章 后 面 对 erro 做 进一步 讨论 。 新 文件 描述 符 总 是 使 用 未 用 描述 
符 的 最 小 值 ， 这 个 特征 在 某 些 情况 下 非常 有 用 。 例 如 ， 如 果 一 个 程序 
天 闭 了 人 它 的 标准 输出 ， 然 后 再 次 调用 open， 文 件 描 述 符 1 就 会 被 重新 使 
用 ， 并 且 标 准 输出 将 被 有 效 地 重 定向 到 另 一 个 文件 或 设备 。 

POSIX 规 范 还 标准 化 了 一 个 creat 调 用 ， 但 它 并 不 常用 。 这 个 调用 
不 仅 会 像 我 们 预期 的 那样 创建 文件 ， 还 会 打开 文件 。 它 的 作用 相当 于 
以 oflags 标 志 O_CREATIO_WRONLYIO_TRUNC 来 调用 open。 

任何 一 个 运行 中 的 程序 能 够 同时 打开 的 文件 数 是 有 限制 的 。 这 个 
限制 通常 是 由 limits.h 头 文件 中 的 常量 OPEN_MAX 定 义 的 ， 它 的 值 随 系 
统 的 不 同 而 不 同 ， 但 POSIX 要 求 它 至 少 为 16。 这 个 限制 本 身 还 受到 本 
地 系统 全 局 性 限制 的 影响 ， 所 以 一 个 程序 未 必 总 是 能 够 打开 这 人 么 多 文 
件 。 在 Linux 系 统 中 ， 这 个 限制 可 以 在 系统 运行 时 调整 ， 所 以 
OPEN_MAX 并 不 是 一 个 常量 。 它 通常 一 开始 被 设置 为 256。 


3.4.4 访问 权限 的 初始 值 


当 你 使 用 带 有 O_CREAT 标 志 的 open 调 用 来 创建 文件 时 ， 你 必须 使 
用 有 3 个 参数 格式 的 open 调 用 。 第 三 个 参数 mode 是 几 个 标志 按 位 或 后 
得 到 的 ， 这 些 标志 在 头 文件 sys/stath。 中 定义 ， 如 下 所 示 。 


S IRUSR: 读 权 限 ， 文 件 属 主 。 

S IWUSR: 写 权 限 ， 文 件 属 主 。 
S_IXUSR: 执行 权限 ， 文 件 属 主 。 
S IRGRP: 读 权 限 ， 文 件 所 属 组 。 
a : 写 权 限 ， 文 件 所 属 组 。 
S IXGRP: 执行 权限 ， 文 件 所 属 组 。 
S IROTH: 读 权 限 ， 其 他 用 户 。 

S IWOTH: SNR, HEHP ° 
S_IXOTH: 执行 权限 ， 其 他 用 户 。 

请 看 下 面 的 例子 : 


open |*myfile*, O CKEAT, S. IRUSR|S IXOTHI 


它 的 作用 是 创建 一 个 名 为 myfile 的 文件 ， 文 件 属 主 拥 有 读 权 限 ， 其 他 
用 户 拥 有 执行 权限 ， 且 只 设置 了 这 些 权限 。 


5 ls -1s myfile 
r-------X } 


EH ETHBIHELHETEISDIEL ES 
Un 
z 
Q 
vs) 
"y 


有 几 个 因素 会 对 文件 的 访问 权限 产生 影响 。 首 先 ， 指 定 的 访问 权 
限 只 有 在 创建 文件 时 才 会 使 用 。 其 次 ， 用 户 掩 码 (由 shell 的 umask 命 令 
设 定 ) 会 影响 到 被 创建 文件 的 访问 权限 。open 调 用 里 给 出 的 mode 值 将 
与 当时 的 用 户 掩 码 的 反 值 做 AND 操 作 。 举 例 来 说 ， 如 果 用 户 撼 码 被 设 
置 为 001， 并 且 指 定 了 S_IXOTH 模 式 标志 ， 那 么 其 他 用 户 对 创建 的 文 
件 不 会 拥有 执行 权限 ， 因 为 用 户 掩 码 中 指定 了 不 允许 向 其 他 用 户 提供 
执行 权限 。 因 此 ，open 和 creat 调 用 中 的 标志 实际 上 是 发 出 设置 文件 访 
问 权限 的 请 求 ， 所 请 求 的 权限 是 否 会 被 设置 取决 于 当时 umask 的 值 

1. umask 

umask 是 一 个 系统 变量 ， 它 的 作用 是 : 当 文 件 被 创建 时 ， 为 文件 
的 访问 权限 设 定 一 个 掩 码 。 执 行 umask 命 令 可 以 修改 这 个 变量 的 值 。 
它 是 一 个 由 3 个 八进制 数字 组 成 的 值 。 每 个 数字 都 是 八进制 值 1、2、4 
的 OR 操作 结果 。 它 们 的 具体 含义 见 表 3-2， 这 3 个 数字 分 别 对 应 着 用 户 

(user) 、 组 (group) 和 其 他 用 户 (other) 的 访问 权限 。 


表 3-2 
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例如 ， 如 果 要 禁止 组 的 写 和 执行 权限 ， 同 时 禁止 其 他 用 户 的 写 权 
限 ， 那 么 umask 值 应 该 如 表 3-3 所 示 。 
X 3-3 


E o * * x 
á 


每 个 数字 的 取 值 OR 在 一 起 ， 因 此 第 2 个 数字 的 值 是 2|1， 结 果 为 
3。 最 终 的 umask 值 为 032 ° 

当 你 通过 open 或 creat 调 用 创建 文件 时 ，mode 参 数 将 与 当前 的 
umask 值 进行 比较 。 在 mode 参 数 中 被 设置 的 位 如 果 在 umask 值 中 也 被 设 
置 了 ， 那 么 它 就 会 从 文件 的 访问 权限 中 删除 。 因 些 ， 用 户 完 全 可 以 设 
置 目 己 的 环境 ， 比 如 “不 准 创建 允许 其 他 用 户 有 写 权 限 的 文件 ， 即 使 创 
建 该 文件 的 程序 要 求 该 权限 也 不 行 。” 这 样 做 虽然 并 不 能 阻止 程序 或 用 
户 在 随后 使 用 chmod 命 令 (或 者 在 程序 中 使 用 chmod 系 统 调 用 ) 来 添加 
其 他 用 户 的 写 权 限 ， 但 它 确实 能 够 帮助 用 户 ， 使 他 们 不 必 对 每 个 新 文 
件 都 去 检查 和 设置 其 访问 权限 。 

2.close 系 统 调用 

你 可 以 使 用 close 调 用 终止 文件 描述 符 馈 des 与 其 对 应 文件 之 间 的 关 
OO 。close 调 用 成 功 时 返回 0， 出 
背 时 返回 -1 e 


#include <unistd.h> 


int close(int fildes); 


注意 ， 检 查 close 调 用 的 返回 结果 非常 重要 。 有 的 文件 系统 ， 
特别 是 网 络 文件 系统 ， 可 能 不 会 在 关闭 文件 之 前 报告 文件 写 操 作 
ne 这 是 因为 在 执行 写 操作 时 ， 数 据 可 能 未 被 确认 写 


3.ioctl 系 统 调用 

ioctl 调 用 有 点 像 古 个 大 杂烩 。 它 提供 了 一 个 用 于 控制 设备 及 其 描 
述 符 行为 和 配置 底层 服务 的 接口 。 终 端 、 文 件 描述 符 、 套 接 字 甚至 磁 
禹 机 都 可 以 有 为 它们 定义 的 ioctl， 具 体 细节 可 以 参考 特定 设备 的 手册 
页 。POSIX 规 范 只 为 流 (stream) 定义 了 iocd 调 用 ， 但 它 超出 了 本 书 讨 
论 的 范围 。 下 面 是 ioctl 的 原型 : 


#include <unistd.h> 


int ioctl(int fildes, int cmd, ...); 


ioctl 对 摘 述 符 fldes 引 用 的 对 象 执行 cmd 参 数 中 给 出 的 操作 。 根 据 
特定 设备 所 支持 操作 的 不 同 ， 它 还 可 能 会 有 一 个 可 选 的 第 三 参数 。 
例如 ， 在 Linux 系 统 上 对 ioctl 的 如 下 调用 将 打开 键 胡 上 的 LED 灯 : 


Di 


ioctl(tty fd, KDSETLED, LED NUM|LED, CAP|LED, SCR); 


X 验 一 个 文件 复制 程序 
在 学 习 了 关于 open、read 和 write 系统 调用 的 知识 以 后 ， 我 们 来 编 
FE E 用 来 逐个 字符 地 把 一 个 文件 复制 到 另 
cud E 
在 本 章 中 ， 我 们 将 采用 多 种 方法 来 完成 这 一 工作 ， 以 比较 各 种 方 
法 的 执行 效率 。 为 简单 起 见 ， 我 们 将 假设 输入 文件 已 经 存在 ， 输 出 文 
件 不 存在 ， 并 且 所 有 的 读 写 操作 都 成 功 。 当 然 ， 在 实际 程序 里 ， 我 们 
必须 检验 这 些 假设 是 否 成 立 ! 
(1) 首先 ， 你 需要 有 一 个 用 于 测试 的 输入 文件 ， 长 度 为 1MB， 
取 名 为 file.in。 
(2) 然后 编译 copy_system.c: 


int in, ut 


JER, #include<unistd.h> 17^ 2i Bi bt HH EN, 为 它 定 义 的 与 
POSIX 规 范 有 关 的 标志 可 能 会 影响 到 其 他 的 头 文 件 。 


(3) 运行 这 个 程序 ， 将 得 到 如 下 的 输出 结果 : 
5 TIMEFORMAT="" time ./copy system 


45.920system 


$ 1s -1s file.in file.out 
029 -rw-r- r I neii 35ers 
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实验 解析 
我 们 在 这 里 使 用 time 工 具 对 这 个 程序 的 运行 时 间 进 行 了 测算 。 
Linux 使 用 TIMEFORMAT 变 量 来 重 置 默认 的 POSIX 时 间 输 出 格式 ， 
POSIX 时 间 格 式 不 包括 CPU 使 用 率 。 你 可 以 看 到 在 这 人 台 相 当 老 的 系统 
上 ，1MB 的 输入 文件 file.in 被 成 功 复制 到 file.out， 后 者 只 允许 属 主 拥有 
读 写 权限 。 但 这 次 复制 花费 了 大 约 两 分 半 钟 ， 并 且 几 乎 消耗 了 所 有 的 
ane 。 之 所 以 这 么 慢 ， 是 因为 它 必 须 完 成 超过 两 百 万 次 的 系统 调 
近 些 年 来 ，Linux 在 系统 调用 和 文件 系统 性 能 方面 有 了 很 大 改善 。 
一 个 类 似 的 测试 在 Linux 2.6 内 核 下 只 需 不 到 14 秒 就 完成 了 。 
$ TIMEFORMAT="" time ./copy system 
2.08user 10.59system 0:13.74elapsed 92%CPU 


Sc US 另 一 个 文件 复制 程序 

你 可 以 通过 复制 大 一 些 的 数据 块 来 改善 效率 较 低 的 问题 ， 请 看 下 
面 这 个 改进 后 的 程序 copy_block.c， 它 每 次 复制 长 度 为 IK 的 数据 块 ， 用 
的 还 是 系统 调用 : 


完 删 除 旧 的 输出 文件 ， 然 后 运行 这 个 程序 : 
$ rm file.out 
$ TIMEFORMAT="" time ./copy block 
0.00user 0.02system 0:00.04elapsed 78%CPU 


实验 解析 

改进 后 的 程序 只 花费 了 百 分 之 几 秒 的 时 间 ， 因 为 它 只 需 做 大 约 
2000 次 系统 调用 。 当 然 ， 这 些 时 间 与 系统 本 身 的 性 能 有 很 大 的 关系 ， 
但 它们 确实 显示 了 系统 调用 需要 巨大 的 开支 因此 值得 对 其 使 用 进行 
化 


还 有 许多 其 他 的 系统 调用 能 够 操作 这 些 底 层 文 件 描述 RE o ETE 
们 ， 程 序 可 以 控制 文件 的 使 用 方式 和 返回 文件 的 状态 信息 
1. lseek 系 统 调用 
lseek 系 统 调用 对 文件 描述 符 fildes 的 读 写 指针 进行 设置 。 也 就 是 
说 ， 你 可 以 用 它 来 设置 文件 的 下 一 个 读 写 位 置 。 读 写 指针 有 既 可 被 设置 
为 文件 中 的 某 个 绝对 位 置 ， 也 可 以 把 它 设 置 为 相对 于 当前 位 置 或 文件 
尾 的 某 个 相对 位 置 。 
#include <unistd.h> 
#include <sys/types.h> 


off t lseek(int fildes, off t offset, int whence); 
offset 参 数 用 来 指定 位 置 ， 而 whence 参 数 定义 该 偏 移 值 的 用 法 。 
whence 可 以 取 下 列 值 之 一 。 
口 SEEK_SET: offset 是 一 个 绝对 位 置 。 


O SEEK CUR: offset 是 相对 于 当前 位 置 的 一 个 相对 位 置 。 

O SEEK END: offset 是 相对 于 文件 尾 的 一 个 相对 位 置 。 

lseek 返 回 从 文件 头 到 文件 指针 被 设置 处 的 字 厄 偏 移 值 ， 失 败 时 返 
回 -1。 参 数 offset 的 类 型 off_t 是 一 个 与 具体 实现 有 关 的 整数 类 型 ， 它 定 
义 在 头 文 件 sys/types.h 中 。 

2 .fstat、stat 和 lstat 系 统 调用 
“fstat 系 统 调用 返回 与 打开 的 文件 接 述 得 相关 的 文件 的 状态 aA, 
该 信息 将 会 写 到 一 个 buf 结 构 中 ，buf 的 地 址 以 参数 形式 传递 给 fstat 。 

下 面 是 它们 的 原型 : 

#include <unistd.h> 

#include <sys/stat.h> 

#include <sys/types.h> 


int fstat(int fildes, struct stat *buf); 
int stat(const char *path, struct stat *buf); 
int lstat(const char *path, struct stat *buf); 


注意 : 包 合 头 文件 sys/types.h 是 可 选 的 ， 但 由 于 一 些 系统 调用 
的 定义 针对 那些 某 天 可 能 会 做 出 调整 的 标准 类 型 使 用 了 别名 ， 所 
以 要 在 程序 中 使 用 系统 调用 时 ， 我 们 还 古 推荐 将 这 个 头 文件 包含 


进去 


相关 函数 stat 和 lstat 返 回 的 是 通过 文件 名 查 到 的 状态 人 信息。 它们 产 
生 相同 的 结 采 ， 但 当 文件 是 一 个 符号 链接 时 ，lstat 返 回 的 是 该 符号 4 
接 本 身 的 信息 ， 而 stat 返 回 的 古 该 链接 指向 的 文件 的 信息 。 

stat 结 构 的 成 员 在 不 同 的 类 UNIX 系 统 上 会 有 所 变化 ， 但 一 般 会 包 
括 表 3-4 中 所 示 的 内 容 。 


X 3-4 
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stat 结 构 中 返回 的 st_mode 标 志 还 有 一 些 与 之 关联 的 突 ， 它 们 定义 
在 头 文件 sys/stath 中 。 这 些 宏 包 括 对 访问 权限 、 文 件 类 型 标志 以 及 一 


些 用 于 帮助 测试 特定 类 型 和 权限 的 掩 码 的 定义 。 
访问 权限 标志 与 前 面 介 绍 的 open 系 统 调 用 中 的 内 容 是 一 样 的 。 文 
件 类 型 标志 如 下 所 示 。 
S_IFBLK: 文件 是 一 个 特殊 的 块 设备 。 
S IFDIR: 文件 是 一 个 目录 。 
S_IFCHR: 文件 是 一 个 特殊 的 字符 设备 。 
S IFIFO: 文件 是 一 个 FIFO (命名 管道 ) 。 
S_IFREG: 文件 是 一 个 普通 文件 。 
S FLNK: 文件 是 一 个 符号 链接 。 
义 下 是 其 他 模式 标志 。 
S_ISUID: 文件 设置 了 SUID 位 。 
S_ISGID: 文件 设置 了 SGID 位 。 
面 列 出 了 用 于 解释 st_mode 标 志 的 掩 码 。 
S IFMT: 文件 类 型 。 
S IRWXU: 属 主 的 读 / 写 /执行 权限 。 
S IRWXG: 属 组 的 读 / 写 /执行 权限 。 
S IRWXO: 其 他 用 户 的 读 / 写 /执行 权限 。 
面 是 一 些 用 来 帮助 确定 文件 类 型 的 宏 定义 。 它 们 只 是 对 经 过 掩 
码 处 理 的 模式 标志 和 相应 的 设备 类 型 标志 进行 比较 。 
S_ISBLK: 测试 是 否 是 特殊 的 块 设备 文件 。 
S_ISCHR: 测试 是 否 是 特殊 的 字符 设备 文件 。 
S ISDIR: 测试 是 否 是 日 录 。 
S ISFIFO: 测试 是 否 是 FIFO。 
S_ISREG: 测试 是 否 是 普通 文件 。 
S ISLNK: 测试 是 否 是 符号 链接 。 
例如 ， 如 果 想 测试 一 个 文件 代表 的 不 是 一 个 日 录 ， 设置 了 属 主 的 
执行 权限 ， 并 且 不 再 有 其 他 权限 ， 你 可 以 使 用 如 下 的 代码 进行 测试 : 


es or E EE 


EL EI 6 


3. dup 和 dup2 系 统 调 用 
dup 系 统 调用 提供 了 一 种 复制 文件 描述 符 的 方法 ， 使 我 们 能 够 通过 
两 个 或 者 更 多 个 不 同 的 描述 符 来 访问 同一 个 文件 。 这 可 以 用 于 在 文件 
的 不 同位 置 对 数据 进行 读 写 。dup 系 统 调用 复制 文件 描述 符 多 des， 返 


E — “SBT ATF > dup2 2 2c Vel AW Vl) Z8 A B TRAE H pote FF RAE 
一 个 文件 摘 述 符 复 制 为 另外 一 个 。 
它们 的 原型 如 下 : 


#include <unistd.h> 


int dup(int fildes); 
int dup2(int fildes, int fildes2); 


”” 当 你 通过 管道 在 多 个 进程 间 进 行 通信 时 ， 这 些 调 用 也 很 有 用 。 我 
们 将 在 第 13 章 对 dup 系 统 调 用 进行 深入 讨论 。 


35 “标准 IO 


标准 MO 库 (stdio) 及 其 头 文件 stdio.h 为 底层 WO 系统 调用 提供 了 一 
个 通用 的 接口 。 这 个 库 现 在 已 经 成 为 ANSI 标 准 C 的 一 部 分 ， 而 你 前 面 
见 到 的 系统 调用 却 还 不 是 。 标 准 IMJO 库 提供 了 许多 复杂 的 函数 用 于 格式 
化 输出 和 扫描 输入 。 它 还 负责 满足 设备 的 缓冲 需求 。 

在 很 多 方面 ， 你 使 用 标准 IO 库 的 方式 和 使 用 底层 文件 描述 符 一 
样 。 你 需要 先 打 开 一 个 文件 以 建立 一 个 访问 路 径 。 这 个 操作 的 返回 值 
将 作为 其 他 IO 库 函 数 的 参数 。 在 标准 JO 库 中 ， 与 底层 文件 描述 符 对 
应 的 是 流 (stream) ， 它 被 实现 为 指向 结构 FILE 的 指针 。 


注意 ， 不 要 把 这 里 的 文件 流 与 Ct+ 语 言 中 的 输入 输出 流 
(iostream) 以 及 AT&T UNIXSystem V Release 3 中 引入 的 进程 间 
通信 中 的 STREAMS 模 型 相 混 消 ，STEAMS 模 型 不 在 本 书 的 讨论 
范围 之 内 。 要 想 进 一 步 了 解 STREAMS ， 请 查阅 X/Open 规范 
( http://www.opengroup.org ) 和 随 System V 版 本 一 起 提供 的 
AT&TSTREAMS Programming Guide ( «AT&T STREAMS 程 序 设 
计 指 南 》) 


在 局 动 程序 时 ， 有 3 个 文件 流 是 自动 打开 的 。 它 们 是 stdin ^ stdout 

和 stderr。 它 们 都 是 在 stdio.h 头 文件 里 定义 的 ， 分 别 代表 着 标准 输入 、 

标准 输出 和 标准 错误 输出 ， 与 底层 文件 描述 符 0、1 和 2 相对 应 。 
在 本 下 里 ， 我 们 将 介绍 标准 MO 库 中 的 下 列 库 函 数 : 

fopen ^ fclose 

fread ^ fwrite 

fflush- 

fseek- 

fgetc ^ getc ^ getchar 

fputc ^ putc ^ putchar 

fgets ^ gets 

printf ` fprintf#lsprintf 

scanf ` fscanf#lsscanf 


3.5.1 fopenER2 


口 口 口 口 口 口 口 口 口 


fopen 库 函数 类 似 于 底层 的 open 系 统 调用 。 它 主要 用 于 文件 和 终端 
的 输入 输出 。 如 果 你 需要 对 设备 进行 明确 的 控制 ， 那 最 好 使 用 确 层 系 
因为 这 可 以 避免 用 库 函 数 带 来 的 一 些 潜 在 问题 ， 如 输入 /输出 
缓冲 e 

该 函数 原型 如 下 : 


#include <stdio.h> 


FILE *fopen(const char *filename, const char *mode); 


fopentT7F FH filename 1 1:8 4E RI SCIT: 并 把 它 与 一 个 文件 流 关 联 
起 来 。mode 参 数 指定 文件 的 打开 方式 ， 它 取 下 列 字 符 串 中 的 值 。 
让 或 “rb”， 以 只 读 方式 打开 。 
uwa ' 或 “wb”: 以 写 方式 打开 ， 并 把 文件 长 度 截 短 为 零 。 

“a” 或 “ab”: 以 写 方式 打开 ， 新 内 容 追 加 在 文件 尾 。 
“T+2 或 “rb+? 或 “r+b”: 以 更 新 方式 打开 OME) e 
“w+” 或 “wb+” 或 “w+b”: 以 更 狐 方 式 打 开 ， 并 把 文件 长 度 截 短 


m 

m 

m 

m 

m 

AE 

p» “at” 或 “ab+” 或 “atb”: 以 更 新 方式 打开 ， 新 内 容 退 加 在 文件 
字母 b 表 示 文 件 是 一 个 二 进 制 文件 而 不 是 文本 文件 。 


请 注意 ， es m 
二 进 制 文件 。UNIX 和 Linux 把 所 有 文件 都 看 作为 二 进 制 文件 。 
一 个 需要 注意 的 地 方 是 mode 参 数 ， 它 必须 是 一 个 字符 串 ， 而 不 是 
一 个 字符 。 所 以 总 是 应 该 使 用 双 引 号 ， 而 不 是 单 引号 。 


fopen 在 成 功 时 返回 一 个 非 空 的 FILE* 指 针 ， 失 败 时 返回 NULL 
值 ，NULL 值 在 头 文件 stdio.h 里 定义 。 

可 用 的 文件 流 数 量 和 文件 摘 述 符 一 样 ， 都 是 有 限制 的 。 实 际 的 限 
制 是 由 头 文件 stdio.h 中 定义 的 FOPEN_MAX 来 定义 的 ， 它 的 值 至 少 为 
8， 在 Linux 系 统 中 ， 通 常 是 16。 


3.5.2 fread WAN 


fread 库 函数 用 于 从 一 个 文件 流 里 读 取 数据 。 数 据 从 文件 流 stream 
TESI Fe pure [8] EJ aH eh E oe fread Fl fwrite Ah MT Za id oe rf ER 
作 ，size 参 数 指 定 每 个 数据 记 了 好 的 长 度 ， 计 数 絮 nitems 给 出 要 传输 的 记 


NR 


录 个 数 。 它 的 返回 值 是 成 功 读 到 数据 缓冲 区 里 的 记录 个 数 (而 不 是 字 
DA 。 当 到 达 文 件 尾 时 ， 它 的 返回 值 可 能 会 小 于 nitems， 甚 至 可 以 
FES ° 

该 函数 原型 如 下 : 


#include <stdio.h> 


size_t fread(void *ptr, size_t size, size t nitems, FILE *stream); 
对 所 有 癌 缓 冲 区 里 写 数 据 的 标准 WO 函数 来 说 ， 为 数据 分 配 空间 和 
检查 错误 是 程序 员 的 届 任 。 请 参见 本 章 后 面 对 ferror 和 feof 函 数 的 介 


AA 
绍 。 


一 


3.5.3 fwrite KN 


fwrite/# Ex 2X  fread AARO 9 EM Fa RE Ae eT DX E A E 
oo 并 把 它们 写 到 输出 流 中 。 它 的 返回 值 是 成 功 写 入 的 记录 个 
F o 


TAR RURAL OO P: 


®include <stdio.h> 


size t fwrite (const void *ptr, size_t size, size t nitems, FILE *stream); 


请 注意 ， 我 们 不 推荐 把 fread 和 fwrite 用 于 结构 化 数据 。 部 分 原 
i fwrite 写 的 文件 在 不 同 的 计算 机 体系 结构 之 间 可 能 不 具备 
A) ASE’ o 


3.5.4 fclose Kğ 


fclose 库 函数 关闭 指定 的 文件 流 stream， 使 所 有 尚未 写 出 的 数据 都 
写 出 。 因 为 stdio 库 会 对 数据 进行 缓冲 ， 所 以 使 用 fclose 是 很 重要 的 。 如 
条 程序 需要 确保 数据 已 经 全 部 写 出 ， 束 应 该 调用 fclose 函 数 。 虽 然 当 程 
序 正常 结束 时 ， 会 目 动 对 所 有 还 打开 的 文件 流 调用 fclose 函 数 ， 但 这 样 
做 你 束 没 有 机 会 检查 由 fclose 报 告 的 错误 了 。 

TAR URAL OO P : 


#include <stdio.h> 


int fclose(FILE *stream); 


3.5.5 fflush 函数 


fflush 库 函数 的 作用 是 把 文件 流 里 的 所 有 末 写 出 数据 立刻 写 出 。 例 
如 ， 你 可 以 用 这 个 函数 来 确保 在 试图 读 入 一 个 用 户 啊 应 之 前 ， 先 同 终 
端 送出 一 个 交互 提示 符 。 使 用 这 个 函数 还 可 以 确保 在 程序 继续 执行 之 
前 重要 的 数据 都 已 经 被 写 到 磁盘 上 。 有 时 在 调试 程序 时 ， 你 还 可 以 用 
它 来 确认 程序 是 正在 写 数据 而 不 是 被 挂 起 了 了。 注意， 调用 fclose 范 数 隐 
合 执 行 了 一 次 ftush 操 作 ， 所 以 你 不 必 在 调用 fclose 之 前 调用 fflush ° 

该 函数 原型 如 下 : 


#include <stdio.h> 


int fflush(FILE *stream); 


3.5.6  fseek PHY 


fseek HAF Iseek BZ Val FAY VA CPA ^. EAE BA 
下 一 次 读 写 操作 指定 位 置 。offset 和 whence 人 参数 的 含义 和 取 值 与 前 面 的 
lseek 系 统 调用 完全 一 样 。 但 lseek 返 回 的 是 一 个 off_t 数 值 ， 而 fseek 返 回 
的 是 一 个 整数 .0 表示 成 功 ，-1 表 示 失 败 并 设置 errno 指 出 错误 。 

该 函数 原型 如 下 : 


#include <stdio.h> 


int fseek(FILE *stream, long int offset, int whence); 


3.5.7 “fgetc、getc 和 getchar 国 数 


fgetc 芳 数 从 文件 流 里 取出 下 一 个 字 节 并 把 它 作 为 一 个 字符 返回 。 
当 它 到 达 文 件 尾 或 出 现 错误 时 ， 它 返回 EOF。 你 必须 通过 ferror 或 feof 
来 区 分 这 两 种 情况 。 

这 些 函 数 的 原型 如 下 : 


#include <stdio.h> 


int fgetc(FILE *stream); 
int getc(FILE *stream); 
int getchar(); 


getc 芳 数 的 作用 和 fgetc 一 样 ， 但 它 有 可 能 被 实现 为 一 个 宏 ， 如 果 
是 这 样 ，stream 参 数 丈 可 能 被 计算 不 止 一 次 ， 所 以 它 不 能 有 副作用 
(例如 ， 它 不 能 影响 变量 ) 。 此 外 ， 你 也 不 能 保证 能 够 使 用 getc 的 地 
址 作为 一 个 函数 指针 。 

getchar 函 数 的 作用 相当 于 getc (stdin) ， 它 从 标准 输入 里 读 取 下 


一 个 字符 。 


3.5.8_fputc、putc 和 putchar 国 数 


fputc 函 数 把 一 个 字符 写 到 一 个 输出 文件 流 中 。 它 返回 写 入 的 值 ， 
如 时 失败 ， 则 返回 EOF e 


#include <stdio.h> 


int fputc(int c, FILE *stream); 
int putc(int c, FILE *stream); 
int putchar(int c); 


类 似 于 fgetc 和 getc 之 间 的 关系 ，putc 函 数 的 作用 也 相当 于 fputc， 但 
它 可 能 被 实现 为 一 个 宏 。 

putchar KH 2044-4 Fpute (c, stdout) ， 它 把 单个 字符 写 到 标准 输 
出 。 注 意 ，putchar 和 getchar 都 是 把 字符 当 作 int 类 型 而 不 是 char 类 型 来 
使 用 的 。 这 就 允许 文件 尾 (EOF) 标识 取 值 -1， 这 是 一 个 超出 字符 数 
字 编 码 范 围 的 值 。 


3.5.9 ”fgets 和 gets 图 数 


fgets 函 数 从 输入 文件 流 stream 里 读 取 一 个 字符 串 。 


#include <stdio.h> 


char *fgets(char *s, int n, FILE *stream); 
char *gets(char *s); 


fgets 把 读 到 的 字符 写 到 s 指 向 的 字符 串 里 ， 直 到 出 现下 面 某 种 情 
Oi: 遇 到 换行 符 ， 已 经 传输 了 n-1 个 字符 ， 或 者 到 达 文 件 尾 。 它 会 把 遇 
到 的 换行 符 也 传递 到 接收 字符 串 里 ， 再 加 上 一 个 表示 结尾 的 空 字 贡 
\0。 一 次 调用 最 多 只 能 传输 n-1 个 字符 ， 因 为 它 必 须 把 空 字 节 加 上 以 结 


当成 功 完 成 时 ，fgets 运 回 一 个 指向 字符 串 s 的 指针 。 如 采 文 件 流 已 
经 到 达 文 件 尾 ，fgets 会 设置 这 个 文件 流 的 EOF 标 识 并 返回 一 个 空 指 


针 。 如 果 出 现 读 错误 ，fgets 返 回 一 个 空 指针 并 设置 ermo 以 指出 错误 的 


gets 函 数 关 似 于 fgets ， 只 不 过 它 从 标准 输入 读 取 数据 并 丢弃 遇 到 
的 换行 符 。 它 在 接收 字符 串 的 尾部 加 上 一 个 null 字 及 。 


注意 : gets 对 传输 字符 的 个 数 并 没有 限制 ， 所 以 它 可 能 会 次 
出 目 己 的 传输 缓冲 区 。 因 此 ， 你 应 该 避免 使 用 它 并 用 fgets 来 代 
伦 。 许 多 安全 问题 都 可 以 追溯 到 在 程序 中 使 用 了 可 能 造成 各 种 组 
冲 区 次 出 的 函数 ，gets 束 是 一 个 这 样 的 钞 数 ， 所 以 千 万 要 小 心 ! 


3.6 格式 化 输 入 和 输 出 


如 采 你 曾经 用 C 语 言 编写 过 程序 ， 那 么 你 应 该 对 那些 按 设 计 格 式 
输出 数据 的 库 函 数 比较 底 悉 。 这 些 画 数 包括 同一 个 文件 流 输 出 数据 的 
printf 系 列 国 数 和 从 一 个 文件 流 读 取 数 据 的 scanf 系 列 函 数 。 


3.6.1 printf ^ fprintf#lsprintf HR 


printf 系 列 函 数 能 够 对 各 种 不 同类 型 的 参数 进行 格式 编排 和 输出 。 
每 个 参数 在 输出 流 中 的 表示 形式 由 格式 参数 format 控 制 ， 它 是 一 个 包 
含 需要 输出 的 普通 字符 和 称 为 转换 控制 符 代码 的 字符 串 ， 转 换 挥 制 符 
规定 了 其 余 的 参数 应 该 以 何 种 方式 被 输出 到 何 种 地 方 。 


#include <stdio.h> 


int printf(const char *format, ...); 
int sprintf(char *s, const char *format, ...); 
int fprintf (FILE *stream, const char *format, ...); 


printf 函 数 把 目 己 的 输出 送 到 标准 输出 。 fprintf KAGE A CL RAT EH 
送 到 一 个 指定 的 文件 流 。sprintf 函 数 把 目 己 的 输出 和 一 个 结尾 空 字符 
p CHR NOD 。 这 个 字符 串 必 须 足 够 容纳 所 有 的 

加 j 

printf 系 列 函 数 还 有 一 些 其 他 的 成 员 ， 它 们 以 各 目 不 同 的 方式 对 其 
参数 进行 处 理 。 更 详细 的 资料 请 参考 printf 的 手册 页 。 

普通 字符 在 输出 时 不 发 生变 化 。 转 换 挥 制 符 让 printf 取 出 传递 过 来 
的 其 他 参数 并 对 它们 的 格式 进行 编排 。 转 换 控 制 符 忌 是 以 % 子 符 开 
头 。 下 面 征 一 个 简单 的 例子 : 
它 在 标准 输出 上 产生 如 下 的 输出 : 


要 想 输出 % 字 符 ， 你 需要 使 用 %9%， 这 样 就 不 会 与 转换 控制 符 混 消 


下 面 是 一 些 泗 用 的 转换 控制 符 。 
O 96d, 96i: 以 十 进 制 格式 输出 一 个 整数 。 
O 960, 96x: 以 八进制 或 十 六 进 制 格式 输出 一 个 整数 。 


%c: 输出 一 个 字符 。 

%s: 输出 一 个 字符 串 。 

%f:， 输 出 一 个 〈 单 精度 ) 浮 点 数 。 

%e: 以 科学 计数 法 格式 输出 一 个 双 精 度 浮 点 数 。 
oOo 96g: 以 通用 格式 输出 一 个 双 精 度 浮 点 数 。 

让 传递 到 printf 函 数 里 的 参数 数目 和 类 型 与 format 字 符 串 里 的 转换 
控制 符 相 匹配 是 非常 重要 的 。 整 数 参数 的 类 型 可 以 用 一 个 可 选 的 长 度 
限定 符 来 指定 。 它 可 以 是 h， 例 如 %hd 表 示 这 是 一 个 短 整 数 (short 
int) ， 或 者 1， 例 如 %1d 表 示 这 是 一 个 长 整数 (long int) 。 有 的 编译 器 
能 够 对 printf 语 句 进行 检查 ， 但 并 非 万 无 一 失 。 如 果 你 使 用 的 是 GNU 编 
译 絮 gcc， 你 可 以 在 编译 命令 中 添加 -Wformat 选 项 以 实现 这 一 功能 。 

下 面 是 另外 一 个 例子 : 


口 口 口 口 


pr 


"E BU HH ze: 


H A Matthew, aged 13.5 


你 可 以 利用 字段 限定 符 对 数据 的 输出 格式 做 进一步 的 控制 。 它 扩 
展 了 转换 控制 符 的 功能 ， 使 得 转换 控制 符 能 够 对 输出 数据 的 间隔 进行 
人 ime 
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字段 限定 符 是 转换 控制 符 里 紧 跟 在 % 字 符 后 面 的 数 子 。 表 3-5 中 列 
出 了 一 些 转 换 控制 符 示 例 及 其 输出 情况 。 为 了 说 明 得 更 清楚 ， 我 们 用 
垂直 线 字 符 来 表示 输出 边界 。 


上 表 中 的 所 有 示例 都 输出 到 一 个 10 个 字符 宽 的 区 域 里 。 注 意 : fü 
值 的 字段 宽度 表示 数据 在 该 字段 里 以 左 对 齐 的 格式 输出 。 可 变 字 段 宽 
度 用 一 个 星 号 (*) 来 表示 。 在 这 种 情况 下 ， 下 一 个 参数 用 来 表示 字段 
宽 。% 字 符 后 面 以 0 开头 表示 数据 前 面 要 用 数字 0 填充 。 根 据 POSIX 规 
范 的 要 求 ，printf 不 对 数据 字段 进行 截断 ， 而 是 扩充 数据 字段 以 适应 数 


据 的 宽度 。 因 此 ， 如 果 你 想 打 印 一 个 比 字 段 宽 度 长 的 字符 串 ， 数 据 字 
段 会 加 宽 ， 如 表 3-6 所 示 。 


X 3-6 


" 式 $ " g u iG 出 | 
printf 范 数 返 回 一 个 整数 以 表明 它 输出 的 字符 个 数 。 但 在 sprintf 的 
返回 值 里 没有 算 上 结尾 的 那个 null 空 人 字符。 如果 发 生 错 误 ， 这 些 函 数 
会 返回 一 个 负 值 并 设置 errno 。 


3.6.2 scanf ^ fscanf7Usscanf 


scanf 系 列 函数 的 工作 方式 与 printf 系 列 函 数 很 相似 ， 只 是 前 者 的 作 
用 是 从 一 个 文件 流 里 读 取 数据 ， 并 把 数据 值 放 到 以 指针 参数 形式 传递 
过 来 的 地 址 处 的 变量 中 。 它 们 也 使 用 一 个 格式 字符 串 来 控制 输入 数据 
的 转换 ， 它 所 使 用 的 许多 转换 控制 符 都 与 printf 系 列 函 数 的 一 样 。 


#include <stdio.h> 


int scanf(const char *format, ...); 
int fscanf(FILE *stream, const char *format, ...); 
int sscanf(const char *s, const char *format, ...); 


scanf 函 数 读 入 的 值 将 保存 到 对 应 的 变量 里 去 ， 这 些 变 量 的 类 型 必 
须 正 确 ， 并 且 它 们 必须 精确 匹配 格式 字符 串 。 否 则 ， 内 存 数 据 束 可 能 
会 遭 到 破坏 ， 从 而 使 程序 月 浇 。 编 译 器 是 不 会 对 此 做 出 错误 提示 的 ， 
但 如 果 你 运气 够 好 ， 你 可 能 会 看 到 一 个 警告 信息 ! 

scanf 系 列 芳 数 的 format 格 式 字 符 串 里 同时 包含 着 普通 字符 和 转换 
控制 牺 ， 就 像 printf 函 数 中 一 样 。 但 在 scanf 系 列 函 数 中 ， 那 些 普 通 字 符 
是 用 于 指定 在 输入 数据 里 必须 出 现 的 字符 。 

下 面 古 一 个 简单 的 例子 : 


这 个 scanf 调 用 只 有 在 标准 输入 中 接 下 来 的 五 个 字符 匹配 “Hello” 的 
情况 下 才 会 成 功 。 然 后 ， 如 果 后 面 的 字符 构成 了 一 个 可 识别 的 十 进 制 
数字 ， 该 数字 就 将 被 读 入 并 赋值 给 变量 num。 格 式 字 符 串 中 的 空格 用 
于 忽略 输入 数据 中 位 于 转换 控制 符 之 间 的 各 种 空白 字符 (空格 、 制 表 
符 、 换 页 符 和 换行 符 ) 。 这 意味 着 在 下 面 两 种 输入 情况 下 ， 这 个 scanf 
调用 都 会 执行 成 功 ， 并 把 1234 放 到 变量 num 里 : 


Hello 1234 
Hellol234 


输入 的 空 晶 字符 在 进行 数据 转换 时 一 般 也 会 被 忽略 。 这 意味 着 ， 
格式 字符 串 %d 将 持续 读 取 输 入 ， 忽 略 空 格 和 换行 符 ， 直 到 找到 一 组 数 
下 转换 将 失败 ，scanf 也 
将 返回 。 


如 果 不 注意 ， 这 会 产生 问题 。 如 果 用 户 在 输入 中 应 该 出 现 一 
个 问 数 的 地 方 用 的 是 一 个 非 数 字 字符 ， 训 可 能 在 程序 里 导 到 一 个 
循环 。 


下 面 是 一 些 其 他 的 转换 控制 符 。 
96d: 读 取 一 个 十 进 制 整数 。 
960 ^ 96x: 读 取 一 个 八进制 或 十 六 进 制 整数 。 
%f、%e、%g: 读 取 一 个 浮 点 数 。 
%c: 读 取 一 个 字符 (不 会 忽略 空格 ) 
%s: 读 取 一 个 字符 串 。 
%[]: 读 取 一 个 字符 集合 ( 见 下 面 的 说 明 ) o 
口 9696: 读 取 一 个 % 字 符 。 

类 似 于 printf，scanf 的 转换 控制 符 里 也 可 以 加 上 对 输入 数据 字段 宽 
度 的 限制 。 长 度 限 定 符 \h 对 应 于 短 ，1 对 应 于 长 ) 指明 接收 参数 的 长 
度 是 否 比 默 认 情 况 更 短 或 更 长 。 这 意味 着 ，%hd 表 示 要 读 入 一 个 短 整 
Ht. Seld UR SEBUA CCASECRONC, MARTERA XU BOSE S 


效 
以 星 号 (*) 开头 的 控制 符 表示 对 应 位 置 上 的 输入 数据 将 被 忽略 。 
这 蕊 味 看 ， 这 个 数据 不 会 被 保存 ， 因 此 不 需要 使 用 一 个 变量 来 接收 
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起 始 的 空白 字符 ， 并 且 会 在 字符 串 里 出 现 的 第 一 个 空 日 字符 处 集 下 
来 ， 所以， 你 最 好 用 它 来 读 取 单词 而 不 是 一 般 意义 上 的 字符 串 。 此 
外 ， 如 果 没 有 使 用 字段 宽度 限定 符 ， 它 能 够 读 取 的 字符 串 的 长 度 是 没 
有 限制 的 ， 所 以 接收 字符 串 必 须 有 足够 的 空间 来 容纳 输入 流 中 可 能 的 
最 长 字符 串 。 较 好 的 选择 是 使 用 一 个 字段 限定 符 ， 或 者 结合 使 用 fgets 


a ETT] 


和 sscanf 从 输入 中 读 入 一 行 数据 ， 再 对 它 进 行 扫描 。 这 样 可 以 避免 可 能 
被 恶意 用 户 利用 的 缓冲 区 盗 出 。 

我 们 使 用 %D 控 制 符 读 取 由 一 个 字符 集合 中 的 字符 构成 的 字符 串 。 
格式 字符 串 %[A-Z] 将 读 取 一 个 由 大 写字 母 构 成 的 字符 串 。 如 果子 符 集 
中 的 第 一 个 字符 是 ^， 束 表示 将 读 取 一 个 由 不 属于 该 字符 集合 中 的 字符 
构成 的 字符 串 。 因 此 ， 读 取 一 个 其 中 市 空格 的 字符 串 ， 并 且 在 直到 第 

个 逗号 时 停止 ， 你 可 以 用 %[^，]。 

给 定 下 面 输 入 行 : 


下 面 的 scanf 调 用 会 正确 读 入 4 个 数据 项 : 


scanf 芳 数 的 返回 值 是 它 成 功 读 取 的 数据 项 个 数 ， 如 采 在 读 第 一 个 
数据 项 时 失败 了 ， 它 的 返回 值 束 将 是 零 。 如 采 在 匹配 第 一 个 数据 项 之 
前 就 已 经 到 达 了 输入 的 结尾 ， 它 就 会 返回 EOF。 如 采 文 件 流 发 生 读 错 
误 ， 流 错误 标志 就 会 被 设置 并 且 错 误 变 量 errno 将 被 设置 以 指明 错误 类 
型 。 详 细 情 况 请 参考 本 草 3.6.4 世 中 的 内 容 。 

MR M M D 
原因 。 


D 从 历史 来 看 ， 它 们 的 具体 实现 都 有 漏洞 。 

口 它们 的 使 用 不 够 灵活 。 

O “使 用 它们 编写 的 代码 不 容易 看 出 究竟 正在 解析 什么 。 

此 外 ， 你 应 竹 试 使 用 其 他 函数 ， 如 fread 或 fgets 来 读 取 输 入 行 ， 青 
用 字符 串 函 数 把 输入 分 解 成 你 需要 的 数据 项 。 


y 


3.6.3 UI 


stdio 函 数 库 里 还 有 一 些 其 他 的 函数 使 用 流 参 数 或 标准 流 stdin、 
stdout 和 stderr， 如 下 所 示 。 

口 fgetpos: 获得 文件 流 的 当前 ( 读 写 ) 位 置 。 

O fsetpos: 设置 文件 流 的 当前 GSS) 位 置 。 

口 ftell: 返回 文件 流 当 前 (BREED) 位 置 的 偏 移 值 。 


rewind: 重 置 文件 流 里 的 读 写 位 置 。 
freopen: 重新 使 用 一 个 文件 流 。 
setvbuf: 设置 文件 流 的 缓冲 机 制 。 
remove: 相当 于 unlink 函 数 ， 但 如 果 它 的 path 参 数 是 一 个 目录 
的 语 RE FHSLIB 2T rmdirERZ 9 
所 有 这 些 库 函数 在 手册 页 的 第 三 节 中 都 有 说 明 。 
你 可 以 使 用 文件 流 画 数 来 重新 实现 前 面 的 文件 复制 程序 。 请 看 下 
面 的 copy_stdio.c 程 序 。 


x 验 第 三 个 文件 复制 程序 
这 个 程序 与 前 面 的 版 本 很 相似 ， 但 逐个 字符 的 复制 工作 改 为 通过 
调用 stdioh 头 文件 里 定义 的 画 数 来 完成 ， 


口 口 口 口 


whit 


像 前 面 那 样 运行 这 个 程序 ， 你 得 到 的 结果 十 : 


5 TIMEFORMAT="" time ./copy stdio 
0.06user 0.02system 0:00.11elapsed 813 


实验 解析 

这 一 次 程序 运行 了 0.11 秒 ， 虽 然 不 如 底层 数据 块 复制 版 本 快 ， 但 
比 那个 一 次 复制 一 个 字符 的 版 本 要 快 得 多 。 这 是 因 为 stdio 库 在 FILE 结 
构 里 使 用 了 一 个 内 部 缓冲 区 ， 只 有 在 缓冲 区 满 时 才 进 行 底 层 系 统 调 
用 。 读 者 可 以 利用 stdio 库 函数 目 行 编写 出 实现 逐 行 复制 和 数据 块 复制 
将 它们 的 执行 性 能 与 我 们 在 本 章 里 给 出 的 3 个 示例 程序 进行 比 
A o 


3.6.4 流 错 ; 


为 了 表明 错误 ， 许 多 stdio 库 函数 会 返回 一 个 超出 范围 的 值 ， 比 如 
空 指针 或 EOF 和 常数 。 此 时 ， 错 误 由 外 部 变量 errno 指 出 : 


#include <errno.h> 


extern int errno; 


注意 ， 许 多 函数 都 可 能 改变 errno 的 值 。 它 的 值 只 有 在 函数 调 
用 失败 时 才 有 意义 。 你 必须 在 函数 表明 失败 之 后 立刻 对 其 进行 检 
查 。 你 应 该 总 是 在 使 用 它 之 前 将 它 先 复制 到 另 一 个 变量 中 ， 因 为 
像 fprintf 这 样 的 输出 函数 本 喘 就 可 能 改变 ermo 的 值 。 


你 也 可 以 通过 检查 文件 流 的 状态 来 确定 是 否 发 生 了 错误 ， 或 者 是 
否 到 达 了 文件 尾 。 


#include <stdio.h> 


int ferror(FILE *stream); 
int feof(FILE *stream); 
void clearerr(FILE *stream); 


ferrorEN Z3 lU 1X — PCPA FS RTA, WRAP A BE I [8] 
一 个 非 零 值 ， 否 则 返回 零 。 

feof 范 数 测试 一 个 文件 流 的 文件 尾 标识 ， 如 末 该 标识 被 设置 束 返 
回 非 零 值 ， 否 则 返回 零 。 我 们 可 以 像 下 面 这 样 使 用 它 : 


if (feof (some_stream) ) 


5 an la = 2 1 
/^* We're at the end 


clearerr K ZI I) 4E H ig E E stream $i [8] AY XC EE GR] Cp Fé hp FN 
音 误 标识 。 它 没有 返回 值 ， 也 未 定义 任何 错误 。 你 可 以 通过 使 用 它 从 
文件 流 的 错误 状态 中 恢复 。 例 如 ， 在 “磁盘 已 满 ” 销 误解 决 之 后 ， 继 续 
开始 写 入 文件 流 。 


3.6.5 i 述 
每 个 文件 流 都 和 -一 个 底层 文件 描述 符 相 关联 。 你 可 以 把 底层 的 答 


入 输出 操作 与 高 层 的 文件 流 操作 混合 使 用 ， 但 一 般 来 说 ， 这 并 不 是 一 
个 明智 的 做 法 ， 因 为 数据 缓冲 的 后 果 难 以 预料 。 


#include <stdio.h> 


int fileno(FILE *stream); 
FILE *fdopen(int fildes, const char *mode); 


Te AT POSSE S fileno ft 数 来 确定 文件 流 使 用 的 是 哪个 确 层 文件 摘 
述 符 。 它 返回 指定 文件 流 使 用 的 文件 描述 符 ， 如 失败 就 返回 -1。 如 果 
你 需要 对 一 个 己 经 打开 的 文件 流 进行 底层 访问 时 (例如 ， 对 它 调用 
fstat) ， 这 个 函数 将 很 有 用 。 

你 可 以 通过 调用 fdopen 函 数 在 一 个 已 打开 的 文件 描述 符 上 创建 一 
个 新 的 文件 流 。 实 质 上 ， 这 个 函数 的 作用 是 为 一 个 已 经 打开 的 文件 摘 
述 符 提供 stdio 绥 冲 区 ， 这 样 解释 可 能 更 容易 理解 一 些 。 

fdopen 芳 数 的 操作 方式 与 fopen 函 数 是 一 样 的 ， 只 是 前 者 的 参数 不 

pd MUR 而 是 一 个 故 层 的 文件 描述 特 。 。 如果 你 已 经 通过 open 系 

统 调用 创建 了 一 个 文件 (可 能 是 出 于 为 了 更 好 地 控制 其 访问 权限 的 目 
Hy) ， 但 又 想 通 过 文件 流 来 对 它 进行 写 操 作 ， 这 个 函数 就 很 有 用 了 。 
fdopen 画 数 的 mode 参 数 与 fopen 函 数 的 完全 一 样 ， 但 它 必 须 符 合 该 文件 
在 最 初 打 开 时 所 设 定 的 访问 模式 。fdopen 返 回 一 个 新 的 文件 流 ， 失 败 
时 返回 NULL ° 


3.7 J2 
。 标准 库 和 系统 调用 为 文件 和 目录 的 创建 与 维护 提供 了 全 面 的 文 


于 


3.7.1 chmod RZ, VaR 


你 可 以 通过 chmod 系 统 调用 来 改变 文件 或 目录 的 访问 权限 。 这 构 
成 了 shell 程 序 chmod 的 基础 。 
该 函数 原型 如 下 : 


#include <sys/stat.h> 


int chmod(const char *path, mode t mode); 
path 参 数 指定 的 文件 被 修改 为 具有 mode 参 数 给 出 的 访问 权限 。 参 
数 mode 的 定义 与 open 系 统 调用 中 的 一 样 ， 也 是 对 所 要 求 的 访问 权限 进 
行 按 位 OR 操 作 。 除 非 程 序 被 赋予 适当 的 特权 ， 人 否则 只 有 文件 的 属 主 或 
超级 用 户 可 以 修改 它 的 权限 。 


’ == 


3.7.2. chownf iya 
超级 用 户 可 以 使 用 chown 系 统 调用 来 改变 一 个 文件 的 属 主 。 


#include <sys/types.h> 
tinclude <unistd.h> 


int chown(const char *path, uid t owner, gid t group); 
这 个 调用 使 用 的 是 用 户 ID 和 组 ID 的 数字 值 (通过 getuid 和 getgid 调 
用 获得 ) 和 一 个 用 于 限定 谁 可 以 修改 文件 属 主 的 系统 值 。 如 果 已 经 设 
置 了 适当 的 特权 ， 文 件 的 属 主 和 所 属 组 就 会 改变 。 


POSIX 规 范 实际 上 人 允许 非 超 级 用 户 改 变 文件 的 属 主 。 虽 然 所 
有 “正确 的 ?POSIX 系 统 都 不 允许 这 样 做 ， 但 严格 来 说 ， 这 是 它 的 
一 个 扩展 规定 (FIPS 151-2) 里 要 求 的 。 我 们 在 本 书 里 讨论 的 系 
统 都 遵守 XSI (X/Open System Interface, X/Open 系统 接口 ) 规范 ， 
并 且 执 行文 件 的 所 有 权 规 则 。 


3.7.3 unlink ` link#lsymlink AZ Ya Hj 


你 可 以 使 用 unlink 系 统 调用 来 删除 一 个 文件 。 

unlink 系 统 调用 删除 一 个 文件 的 目录 项 并 减少 它 的 链接 数 。 它 在 
成 功 时 返回 0， 失 败 时 返回 -1。 如 果 想 通过 调用 这 个 函数 来 成 功 删除 文 
件 ， 你 本 必须 拥有 该 文件 所 属 目 永 的 写 和 执行 权限 。 


#include <unistd.h> 


int unlink(const char *path); 
int link(const char *pathi, const char *path2); 
int symlink(const char *pathl, const char *path2); 


如 有 果 一 个 文件 的 链接 数 减 少 到 零 ， 并 且 没 有 进程 打开 它 ， 这 个 文 
件 束 会 被 删除 。 事 实 上 ， 目 录 项 总 是 补 立 刻 删 除 ， 但 文件 所 占用 的 空 
间 要 等 到 最 后 一 个 进程 (如果 有 的 话 ) 关闭 它 之 后 才 会 被 系统 回收 。 
A LRL eA ty 。 文件 上 其 他 的 链接 表示 这 个 文件 还 有 其 
他 名 字 ， 这 通常 是 由 In 程序 创建 的 。 你 可 以 使 用 link 系 统 调用 在 程序 中 
创建 一 个 文件 的 新 链接 。 


先 用 open 创 建 一 个 文件 ， 然 后 对 其 调用 unlink 是 某 些 程序 员 用 
来 创建 临时 文件 的 技巧 。 这 些 文件 只 有 在 被 打开 的 时 候 才能 被 程 
en een 


link 系 统 调用 将 创建 一 个 指 癌 已 有 文件 path1 的 新 链 接 。 新 目 
由 path2 给 出 。 你 可 以 通过 symlink 系 统 调用 以 夫 似 的 方式 创建 符号 链 
is ° 注意 ， 一 个 文件 的 符号 链接 并 不 会 增加 该 文件 的 链接 数 ， 所 以 它 
会 像 普通 (BE) 链接 那样 防止 文件 被 删除 。 


3.7.4 mkdirxirmdir 35 Zi YAR 


你 可 以 使 用 mkdir 和 rmdir 系 统 调用 来 建立 和 删除 目录 。 


#include <sys/types.h> 
#include <sys/stat.h> 


int mkdir(const char *path, mode_t mode); 


mkdir 系 统 调 用 用 于 创建 目录 ， 它 相当 于 mkdir 程 序 。mkdir 调 用 将 
参数 path 作 为 新 建 目 录 的 名 字 。 目 录 的 权限 由 参数 mode 设 定 ， 其 含义 


将 按 open 系 统 调用 的 O CREAT 选 项 中 的 有 关 定 义 设 置 。 当 然 ， 它 还 要 
服从 umask 的 设置 情况 。 


#include <unistd.h> 


int rmdir(const char *path); 


rmdir 系 统 调用 用 于 删除 目录 ,但 只 有 在 目录 为 空 时 才 行 。rmdir 程 
序 就 是 用 这 个 系统 调用 来 完成 工作 的 。 


Igetcwd HAN 


程序 可 以 像 用 户 在 文件 系统 里 那样 来 浏览 目录 。 束 像 你 在 shell 里 
使 用 cd 命令 来 切换 目录 一 样 ， 程 序 使 用 的 古 chdir 系 统 调 用 。 


#include <unistd.h> 


int chdir(const char *path); 


程序 可 以 通过 调用 getcewd 函 数 来 确定 目 己 的 当前 工作 目录 


#include <unistd.h> 


char *getcwd(char *buf, size_t size); 


getcwd KAGE 24 Ai H RA FS IAEA RH buf » WA 
名 的 长 度 超 出 了 参数 size 给 出 的 缓冲 区 长 度 (一 个 ERANGE 错 误 ) , 
它 就 返回 NULL。 如果 成 功 ， 它 返回 指针 buf 。 


如 果 在 程序 运行 过 程 中 ， 目 录 被 删除 \EINVAL 错 误 ) 或 者 
有 关 权 限 发 生 了 变化 (EACCESS 错 误 ) ，getcwd 也 可 能 会 返回 
NULL ° 


3.8 扫描 目录 


Linux 系 统 上 一 个 常见 问题 就 是 扫描 目录 ， 也 就 是 确定 一 个 特定 目 
录 下 存放 的 文件 。 在 shell 程 序 设计 中 ， 这 很 容易 做 到 只 需 让 shell 
做 一 次 表达 式 的 通配符 扩展 。 在 过 去 ，UNIX 操 作 系 统 的 各 种 变 体 都 允 
许 用 户 通过 编程 访问 底层 文件 系统 结构 。 你 仍然 可 以 把 目录 当 作 一 个 
普通 文件 那样 打开 ， 并 直接 读 取 目录 数据 项 ， 但 不 同 的 文件 系统 结构 
及 其 实现 已 经 使 这 种 方法 没什么 可 移植 性 了 。 现 在 ， 一 整套 标准 的 库 
函数 已 经 被 开发 出 来 ， 使 得 目录 的 扫 摘 工作 变 得 简单 多 了 。 

与 目录 操作 有 关 的 函数 在 dirent.h 头 文件 中 声明 。 它 们 使 用 一 个 名 
为 DIR 的 结构 作为 目录 操作 的 基础 。 被 称 为 目录 流 的 指 问 这 个 结构 的 
Bit (DIR*) 被 用 来 完成 各 种 目录 操作 ， 其 使 用 方法 与 用 来 操作 普通 
文件 的 文件 流 (FILE *) 非常 相似 。 目 录 数 据 项 本 身 则 在 dirent 结 构 中 
返回 ， 该 结构 也 是 在 dirent.h 头 文件 里 声明 的 ， 这 是 因为 用 户 不 应 直接 
改动 DIR 结 构 中 的 数据 字段 。 

我 们 将 介绍 下 面 这 几 个 函数 : 
opendir 、 closedir 
readdir 
telldir 
seekdir 
closedir 


3.8.1 opendir HR. 


opendir 芳 数 的 作用 是 打开 一 个 日 录 并 建立 一 个 目录 流 。 如 果 成 
功 ， 它 返回 一 个 指向 DIR 结 构 的 指针 ， 该 指针 用 于 读 取 目录 数据 项 。 
#include <sys/types.h> 
#include «dirent.h» 


EJ Ji 3 


DIR *opendir(const char *name); 
opendir 在 失败 时 返回 一 个 空 指针 。 注 意 ， 目 杂 流 使 用 一 个 底层 文 
Ba rea gua ba ea (ODD HS 
Ji o 


3.8.2 readdir Hv 


readdir 函 数 返 回 一 个 指针 ， 该 指针 指 加 的 结构 里 保存 着 目录 流 dirp 
中 下 一 个 目录 项 的 有 关 资 料 。 后 续 的 readdir 调 用 将 返回 后 续 的 目录 
项 。 如 果 发 生 错误 或 者 到 达 目 录 尾 ，readdir 将 返回 NULL。POSIX 兼 容 
的 系统 在 到 达 目 录 尾 时 会 返回 NULL ， 但 并 不 改变 errno 的 值 ， 只 有 在 
发 生 错误 时 才 会 设置 errno。 
#include <sys/types.h> 
#include <dirent.h> 


struct dirent *readdir(DIR *dirp); 


JER, WR readdir HEF fi A SAA ID EL ERE TE TA Boe 

a ，readdir 将 不 保证 能 够 列 出 该 目 孙 里 的 所 有 文件 
B 

dirent 结 构 中 包含 的 目录 项 内 容 包 括 以 下 部 分 。 

O ino td ino: 文件 的 inode 节 点 号 。 

O chard name[]: 文件 的 名 字 。 

要 想 进 一 步 了 解 目 录 中 某 个 文件 ， 你 需要 使 用 在 本 章 前 面 介 绍 过 
的 stat 调 用 。 


3.8.3 telldir A 3% 


telldirEk AXA IB ic Rae ait AY SB ° PRAY AEG 
Ja Wseekdirial H FA Fix “MEDR A RHA S Brice o 


#include <sys/types.h> 
#include «dirent.h» 


long int telldir(DIR *dirp); 


3.8.4  seekdir 
seekdir 函 数 的 作用 是 设置 目录 流 dirp 的 目录 项 指针 。loc 的 值 用 来 
设置 指针 位 置 ， 它 应 该 通过 前 一 个 telldir 调 用 获得 。 


#include <sys/types.h> 
#include <dirent.h> 


void seekdir(DIR *dirp, long int loc); 


3.8.5 closedir RA 


closedirER ZA X P] — A BRIER SZ KRY BTU ^ EDU B 
功 时 返 同 0， 发 生 错 误 时 返回 -1。 

#include <sys/types.h> 

#include <dirent.h> 


int closedir(DIR *dirp); 


在 下 面 的 printdirc 程 序 中 ， 你 将 把 许多 文件 处 理 函 数 集 中 在 一 起 
以 实现 一 个 简单 的 目录 列表 功能 。 目 录 中 的 每 个 文件 单独 列 在 一 行 
上 每 个 了 于 目录 会 在 它 的 名 他 语 面 加 .上 一 个 笑 线 字符 /了 于 目录 中 的 文 
件 在 缩 进 四 个 空格 后 依次 排列 。 

程序 会 逐个 切换 到 每 个 下 级 子 目录 里 ， 这 样 使 它 找到 的 文件 都 有 
一 个 可 用 的 名 字 。 也 束 是 说 ， 它 们 都 可 以 被 直接 传递 给 opendir 函 数 。 
如 入 目录 的 舱 套 层次 太 深 ， 程 序 执行 融会 失败 ， 这 是 因为 对 允许 打开 
的 目录 流 数目 是 有 限制 的 。 

我 们 当然 可 以 采取 一 个 更 通用 的 做 法 ， 让 程序 能 够 通过 一 个 命令 
行 参数 来 指定 起 点 (从 哪个 目录 开始 ) 。 请 查阅 有 关 工 具 程序 (Ws 
和 find) 的 Linux 源 代码 来 找到 实现 更 通用 程序 的 方法 。 


实 验 一 个 目标 扫描 程序 

(1) 程序 的 开始 是 一 些 必要 的 头 文件 。 接 下 来 是 printdir 函 数 ， 它 
的 作用 是 输出 当前 目 孙 的 内 容 。 它 将 递归 通 历 各 级 子 目 未 ， 使 用 depth 
参数 来 控制 缩 排 。 


ginclude <dirent.h> 
include <string.h> 
Sinclude <syz/stat.h> 
include <stdlib.h> 


void printdir|char "dir, int depth) 
( 


DIR "dp; 
atruct dirent *entryi 
struct stat gtatbuf; 


ifi|dp * opendir(dir)) == NULL] ( 
fprintf|stáwrr,'cannot open directory: tain’, dir]; 
return; 
} 
chdir (dir); 
while{ (entry = readdir(dp)) 1+ NULL) { 
latat(entry-»d name,&éatatbuf) ; 
ifi& I5DIR(atatbuf.st model! ( 
/* found a directory, but ignore . and .. */ 
ifistrempi*.*,antry-»d nane) == 0 || 
Strcmp|'..",entry-»d name] == Q) 
continue: 
printf|**t*gte/An*, depth, ** ,entry-»d, name]: 
/* Recurse at a new indent level */ 
printdir(entry-»d name,depthe4) : 
J 
else printl(*t*sta\n*. depth, * * entry->d_nane) ; 


dici. .*) 

closedir[dp!: 
j 

(2) 下 面 是 main 函 数 
int saini] 


printf (*Directory scan of /home:in*]: 
printdir(*/home*,0):; 
printf(*dona. Wn") ; 


exír(0): 


这 个 程序 扫描 home 目 录 并 产生 如 下 所 示 的 输出 (经 过 简化 ) 
果 想 扫描 其 他 用 户 的 目录 ， 你 可 能 需要 超级 用 户 的 权限 。 


$ ./printdir 
Directory scan cf /home: 
neil/ 
.Xdefaults 
.Xmodmap 
.Xresources 
-bash_history 
»bashre 


实验 解析 

绝 大 部 分 操作 都 是 在 printdir 函 数 里 完成 的 。 在 用 opendir 函 数 检 查 
完 指定 日 好 是 否 存 在 后 ，printdir 调 用 chdir 进 入 指定 日 隶 。 如 果 readdir 
函数 返回 的 数据 项 不 为 空 ， 程 序 就 检查 该 数据 项 是 否 是 一 个 目录 。 如 
果 不 是 ， 程 序 就 根据 depth 的 值 缩 进 打印 该 文件 数据 项 的 内 容 。 

如 果 该 数据 项 是 一 个 目 永 ， 你 束 需 要 对 它 进 行 递 归 通 历 。 在 跳 过 . 
和 .. 数 据 项 (它们 分 别 代 表 当 前 目录 和 上 一 级 日 录 ) 后 ，Pprintdir 函 数 调 
用 目 己 并 再 次 进入 一 个 同样 的 处 理 过 程 。 那 它 又 是 如 何 退出 这 些 循环 
AWE? 一 旦 while 循 环 完成 ，chdir (“..”) 调用 将 把 它 带 回 到 目录 树 的 
上 一 级 ， 从 而 可 以 继续 进行 上 级 目录 的 人 遍历。 调用 closedir (dp) 关闭 
目录 是 为 了 确保 打开 的 目录 流 数 日 不 超出 其 需要 。 

作为 对 第 4 章 所 介绍 的 Linux 环 境 的 一 个 简短 尝试， 让 我 们 来 看 一 
个 能 够 使 这 个 程序 更 具 通 用 性 的 方法 。 这 个 程序 的 功能 受 限 是 因为 它 
只 能 对 目录 /home 进 行 操作 。 如 果 我 们 按 下 面 的 方法 对 main 函 数 进行 修 
改 ， 束 能 把 它 变 成 一 个 更 有 用 的 目录 浏览 履 : 


我 们 修改 了 3 条 语句 ， 增 加 了 5 条 语句 ， 它 现在 是 一 个 通用 的 工具 
程序 了 。 它 多 了 一 个 可 选 的 目录 名 参数 ， 其 默认 值 是 当前 目录 。 你 可 
以 通过 下 面 的 命令 运行 它 : 


s ./printdira2 /usr/local | sore 


输出 结果 将 分 页 显示 ， 用 户 可 以 通过 翻 页 查看 其 输出 。 可 以 说 ， 
用 户 现 在 有 了 一 个 非常 方便 、 通 用 的 目录 树 浏 顺 郁 。 你 不 必 人 花费 过 多 
精力 就 可 以 为 这 个 程序 再 增加 空间 占用 统计 、 裔 历 深度 限制 等 其 他 功 


eU 
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3.9 错误 处 理 


正如 你 已 经 看 到 的 ， 本 章 介 绍 的 许多 系统 调用 和 函数 都 会 因为 各 
种 各 样 的 原因 而 失败 。 它 们 会 在 失败 时 设置 外 部 变量 ermo 的 值 来 指明 
失败 的 原因 。 许 多 不 同 的 函数 库 都 把 这 个 变量 用 做 报告 错误 的 标准 方 
法 。 值 得 重申 的 是 ， 程 序 必 须 在 函数 报告 出 错 之 后 立刻 检查 errno 变 
量 ， 因 为 它 可 能 被 下 一 个 函数 调用 所 履 盖 ， 即 使 下 一 个 函数 目 身 并 没 
有 出 错 ， 也 可 能 会 履 盖 这 个 变量 。 

错误 代码 的 取 值 和 含义 都 列 在 头 文件 errno.h 里 ， 如 下 所 示 。 
EPERM: 操作 不 允许 。 

ENOENT': 文 件 或 目 永 不 存在 。 
EINTR: 系统 调用 被 中 断 。 
EIO: IO 错误 。 
EBUSY: 设 备 或 资源 忙 。 
EEXIST: 文 件 存在 。 
EINVAL: 无 效 参数 。 
EMFILE: 打 开 的 文件 过 多 。 
ENODEV: 设备 不 存在 。 
EISDIR: 是 一 个 目录 。 
口 ENOTDIR: 不 是 一 个 目录 。 
有 两 个 非常 有 用 的 函数 可 以 用 来 报告 出 现 的 错误 ， 它 们 是 strerror 
Hperror ° 
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3.9.1 strerror 

strerror 函 数 把 错误 代码 映射 为 一 个 字符 串 ， 该 字符 串 对 发 生 的 错 
误 类 型 进行 说 明 。 这 在 记录 错误 条 件 时 十 分 有 用 。 

该 函数 原型 如 下 : 


#include <string.h> 


char *strerror(int errnum); 


3.9.2 perrorÉN2N 


perror EX Zi 8, FE errno 2 5& FP FRE AY 24 gi £8 RR 81] — 1 SE 45] ER , 
并 把 它 输 出 到 标准 错误 输出 流 。 该 字符 串 的 前 面 先 加 上 字符 串 s (OR 
不 为 空 ) 中 给 出 的 信息 ， 再 加 上 一 个 冒号 和 一 个 空格 。 

该 函数 原型 如 下 : 


#include <stdio.h> 


void perror(const char *s); 


请 看 下 面 的 例子 : 


它 可 能 在 标准 错误 输出 中 给 出 如 下 的 输出 结 


3.10  /proc 文件 系统 


我 们 在 前 面 提 到 过 ，Linux 将 一 切 事 物 都 看 作为 文件 ， 硬 件 设备 在 
文件 系统 中 也 有 相应 的 条 目 。 我 们 使 用 底层 系统 调用 这 样 一 种 特殊 方 
式 通过 /dev 目 好 中 的 文件 来 访问 硬件 。 

控制 硬件 的 软件 张 动 程序 通 音 可 以 以 某 种 特定 方式 配置 ， 或 者 能 
够 报告 相关 信息 。 例 如 ， 一 个 人 硬盘 控制 程序 可 以 说 配置 为 使 用 一 个 特 
殊 的 DMA 模 式 。 一 块 网 卡 可 以 报告 它 是 否 协商 了 一 个 高 速 、 双 工 的 连 


接 

用 于 与 设备 驱动 程序 进行 通信 的 工具 在 过 去 就 已 经 十 分 常见 。 例 
如 ，hdparm 可 以 用 来 配置 一 些 人 磁盘 参数 ，ifconfig 可 以 报告 网 络 统 计 信 
轧 。 近 年 来 ， 倾 回 于 提供 更 一 致 的 方式 来 访问 张 动 程序 的 信息 。 事 实 
上 上 ， 这 种 一 致 的 方式 甚至 延伸 到 包括 与 Linux 内 核 的 各 种 元 素 的 通信 。 

Linux 提 供 了 一 个 特殊 的 文件 系统 procfs， 它 通常 以 /proc 目 录 的 形 
式 呈 现 。 该 目录 中 包含 了 许多 特殊 文件 用 来 对 驱动 程序 和 内 核 信息 进 
行 更 高 层 的 访问 。 只 要 应 用 程序 有 正确 的 访问 权限 ， 它 们 就 可 以 通过 
读 写 这 些 文件 来 获得 信息 或 设置 参数 。 

/proc 目 隶 中 的 文件 会 随 系 统 的 不 同 而 不 同 ， 当 Linux 版 本 中 有 更 多 
的 驱动 程序 和 设施 支持 procfs 文 件 系 统 时 ， 该 日 如 中 就 会 包含 更 多 的 文 
件 。 在 这 里 ， 我 们 将 介绍 一 些 /proc 目 了 永 中 利用 的 文件 ， 并 简单 讨论 它 
们 的 用 途 。 

用 来 撰写 本 间 内 容 的 电脑 上 的 /proc 目 隶 列 表 包 括 如 下 项 目 : 


在 多 数 情况 下 ， 只 需 直 接 读 取 这 些 文件 就 可 以 获得 状态 信息 。 例 
如 ，/proc/cpuinfo 给 出 的 是 cpu 的 详细 信息 .: 


$ cat /proc/cpuinfo 


processor 


vendor, id : GenuineIntel 
cpu family : 15 
model 2 
model name Intel(R) Pent IR) 4 CPU 2.66GHz 
stepping A 
pu Mz 2665.3 
4 " ze $12 KB 
yea 
ye 
fpu vme de pee t mer pae moe cx8 apic sep mtrr pge mca cm pa 
p 4 acpi om fx TT a? ss ur 
bogosips : 5413,47 


izti1ush ai 


"UO "deutet 分 别 给 出 的 是 内 存 使 用 情况 
和 内 核 版 本 信息 : 


5 cat /proc/maninfo 
Total: ; 


*m 
tee w b onm is ic 


1 
High i kB 
Hi ghFree kB 
LowTotal 776156 kh 
OwFres: 285 B ag 
wapTotal $4672 kB 
wapPree 164652 kD 
Dirty 68 kö 
Writeback 0 x9 
AnonPages 15345 kB 
Mapped $9044 kB 
lab $7848 kh 
SReclaismable: $p kī 
BUnreclaim 21860 XH 
PageTables 1500 kB 
Unstable: kB 


CommitLimit: 
Committed AS: 
VmallocTotal: 
Vina LlocUsed: 


VeallocChunk: 234556 kB 

HugePagez Total 

HugePages F Ü 

HugePages 0 

Hugepagesize: 4096 kB 

$ cat /proc/version 

Linux version 2.6.20.2-2-default buildhost! [gcc n 6.1.3 7 a 
prerelease SUSE Linux 0) SMP Fri Mar 13:54:10 UN 


每 次 读 取 这 些 文件 的 内 容 时 ， 它们 所 提供 的 信息 都 会 及 时 更 新 。 
所 以 再 读 一 次 meminfo 文 件 会 给 出 最 新 的 信息 


YR AY DAHER EAN TK AK aS SA, ELTE /proc H RAI 
Ern 。 例 如 ， 你 可 以 通过 /proc/net/sockstat 文 件 获得 网 络 套 接 字 的 
Zu]: 


$ cat /proc/net/sockstat 


sockets: used 2 

TCP: iuse 4 orpha 1 " 
UDP: use 3 

UDPLITE: inuse 

RAW use 0 

FRAG 


/proc 目 录 中 的 有 些 条 目 不 仅 可 以 被 读 取 ， 而 且 可 以 被 修改 。 例 
如 ， 系 统 中 所 有 运行 的 程序 同时 能 打开 的 文件 总 数 是 Linux 内 核 的 一 个 
参数 。 它 的 当前 值 可 通过 读 取 /proc/sys/fs/file-max 文 件 得 到 : 
$ cat /proc/sys/fs/file-max 
76593 

这 个 值 被 设置 为 76593。 如 果 你 需要 增 大 该 值 ， 则 可 以 通过 写 同 一 
个 文件 来 实现 。 如 果 你 正在 运行 一 个 需要 同时 打开 很 多 文件 的 应 用 程 
fe en eee ene ay tae 
人 o 


WY /proc H ae PA SCPE ETT 5 TRAE Ta RB Ro ITE 
修改 数据 时 需要 特别 小 心 ， 写 入 不 适当 的 值 可 能 会 引发 户 重 的 问 
题 ， 比 如 系统 朋 涡 和 数据 丢失 。 


如 果 要 将 系统 范围 的 文件 句柄 限制 增加 为 80 000， 你 只 需 将 新 的 
EBRES A file-max LBN n] : 


现在 ， 当 你 再 次 读 取 该 文件 时 ， 你 就 可 以 看 到 新 设 定 的 值 : 

$ cat /proc/sys/fs/file-max 
80000 

/proc 目 录 中 以 数字 命名 的 子 目 录用 于 提供 正在 运行 的 程序 的 信 
息 。 你 将 在 第 11 章 中 学 习 程 序 如 何以 进程 的 方式 执行 。 

现在 ， 你 只 需要 知道 每 个 进程 都 有 一 个 唯一 的 标识 符 : 一 个 在 1~- 
32000 的 数字 。ps 命 令 会 给 出 当前 正在 运行 进程 的 列表 。 例 如 ， 在 本 章 
正在 编写 的 时 候 : 


你 可 以 看 到 有 几 个 正在 运行 bash shell 的 终端 会 话 和 一 个 正在 运行 
p oe 。 你 可 以 通过 查看 /proc 目 录 来 获得 更 多 关于 ftp 
会 话 的 细节 e 

ftp 的 进程 标识 符 是 9118， 所 以 你 需要 得 看 /proc/9118 来 获得 关于 它 
的 更 多 细节 : 


> ls -1 /proc/9118 


你 可 以 看 到 各 种 特殊 文件 ， 它 们 可 以 告诉 你 该 进程 的 相关 信息 。 

从 上 面 的 输出 中 你 可 以 知道 程序 /usr/bin/pftp 正 在 运行 ， 它 的 当前 
工作 目录 是 /home/nei/BLP4e/chapter03。 通 过 查看 这 个 目录 下 的 其 他 
文件 ， 你 还 可 以 看 到 启动 它 的 命令 行 以 及 它 的 shell 环 境 。cmdline 和 
environ 文 件 以 一 系列 null 终 止 的 字符 串 来 提供 这 些 信息 ， 所 以 你 在 查 
看 它们 时 需要 小 心 。 我 们 将 在 第 4 章 对 Linux 环 境 进 行 深 入 讨论 。 


od ~C /proc/9118/cmdline 


你 可 以 看 到 ftp 是 由 命令 行 ftp 192.168.0.12 启 动 的 。 
fd 子 目 录 提 供 该 进程 正在 使 用 的 打开 的 文件 描述 符 的 信息 。 这 个 
信息 在 确定 一 个 程序 同时 打开 了 多 少 文 件 时 十 分 有 用 。 每 个 打开 的 摘 


述 符 都 有 对 应 的 一 个 条 目 ， 条 目 名 字 与 描述 符 的 数字 相 匹 配 。 在 本 例 
中 ， 你 可 以 看 到 ftp 如 我 们 所 预期 的 那样 打开 了 0、1、2 和 3 搬 述 符 。 它 
们 分 别 是 标准 输入 、 标 准 输 出 和 标准 错误 描述 符 以 及 一 个 到 远程 服务 
PREES ° 

S ls /proc/9118/fd 

0 ; 


? 2 
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3.11 ”高 级 主题 ，fcnt1 和 mmap 


本 市 我 们 将 讨论 的 主题 你 可 能 会 想 跳 过 ， 因 为 它们 很 少 会 被 用 
到 。 话 虽 如 此 ， 但 我 们 还 是 把 它 放 在 这 里 供 你 参考 ， 因 为 在 解决 一 些 
天 手 问 题 时 ， 它 们 可 以 提供 比较 简单 的 解决 方案 。 


fcnt1 系 统 调用 对 确 层 文件 揪 述 符 提供 了 更 多 的 操纵 方法 。 


#include «fcntl.h» 


int fentl(int fildes, int cmd); 
int fcntl(int fildes, int cmd, long arg); 


利用 fcnt1 系 统 调用 ， 你 可 以 对 打开 的 文件 描述 符 执 行 各 种 操作 ， 
包括 对 它们 进行 复制 、 获 取 和 设置 文件 描述 符 标 志 、 获 取 和 设置 文件 
状态 标志 ， 以 及 管理 建议 性 文件 锁 等 。 
对 不 同 操作 的 选择 是 通过 选取 命令 参数 cmd 不 同 的 值 来 实现 的 ， 
其 取 值 定义 在 头 文件 fcnt1.h 中 。 根 据 所 选择 命令 的 不 同 ， 系 统 调 用 可 
能 还 需要 第 三 个 参数 arg 。 
O fcntl (fildes, F DUPFD, newfd): 这 个 调用 返回 一 个 新 的 文件 
描述 符 ， 其 数值 等 于 或 大 于 整数 newfd。 新 文件 描述 符 是 描述 符 
fildes 的 一 个 副本 。 根 据 已 打开 文件 数目 和 newfd 值 的 情况 ， 它 的 
效果 可 能 和 系统 调用 dup (fildes) 完全 一 样 。 
O fcntl (fildes, F GETFD): 这 个 调用 返回 在 fcnt1.h 头 文件 里 定义 
的 文件 描述 符 标 志 ， 其 中 包括 FD_CLOEXEC， 它 的 作用 是 决定 是 
否 在 成 功 调 用 了 某 个 exec 系 列 的 系统 调用 之 后 关闭 该 文件 描述 
fF o 
口 fcntl (fildes, F SETFD, flags): 这 个 调用 用 于 设置 文件 描述 符 
标志 ， 通 常 仅 用 来 设置 FD_ CLOEXEC 。 
口 fcntl (fildes, F GETFL) 和 fcntl (fildes, F SETFL, flags): 这 两 
个 调用 分 别 用 来 获取 和 设置 文件 状态 标志 和 访问 模式 。 你 可 以 利 
用 在 fent1.h 头 文件 中 定义 的 掩 码 O_ACCMODE 来 提取 出 文件 的 访 
问 模 式 。 其 他 标志 包括 那些 当 open 调 用 使 用 O_CREAT 打 开 文 件 时 


作为 第 三 参数 出 现 的 标志 。 注 意 ， 你 不 能 设置 所 有 的 标志 ， 特 别 

是 不 能 通过 fcnt1 设 置 文件 的 权限 。 

你 还 可 以 通过 fcnt1 实 现 建议 性 文件 锁 。 详 细 信息 请 参考 fcnt1 手 册 
页 的 第 二 节 ， 或 者 阅读 本 书 的 第 7 革 ， 我 们 将 在 那里 讨论 文件 锁 。 


3.11.2 mmap 图 数 


UNIX 提 供 了 一 个 有 用 的 功能 以 允许 程序 共 译 内 存 ，Linux 内 核 从 
2.0 版 本 开始 已 经 把 这 一 功能 包括 进来 。mmap (AAR) 函数 的 作 
用 是 建立 一 段 可 以 说 两 个 或 更 多 个 程序 读 写 的 内 存 。 一 个 程序 对 它 所 
做 出 的 修改 可 以 被 其 他 程序 看 见 。 

这 一 功能 还 可 以 用 在 文件 的 处 理 上 。 你 可 以 使 某 个 做 盘 文 件 的 全 
部 内 容 看 起 来 束 像 古 内 存 中 的 一 个 数组 。 如 果 文 件 由 记录 组 成 ， 而 这 
些 记 录 义 能 够 用 C 语 言 中 的 结构 来 描述 的 话 ， 你 束 可 以 通过 访问 结构 
数组 来 更 新 文件 的 内 容 了 。 

这 要 通过 使 用 市 特殊 权限 集 的 虚拟 内 存 段 来 实现 。 对 这 类 虚拟 内 
存 段 的 读 写 会 使 操作 系统 去 读 写 磁 强 文 件 中 与 之 对 应 的 部 分 。 

mmap 函 数 创 建 一 个 指 同 一 段 内 存 区 域 的 指针 ， 该 内 存 区 域 与 可 以 
通过 一 个 打开 的 文件 描述 符 访 问 的 文件 的 内 容 相 关联 。 


#include <sys/mman.h> 


你 可 以 通过 传递 off 参 数 来 改变 经 共 至 内 存 段 访问 的 文件 中 数据 的 
起 始 偏 移 值 。 打 开 的 文件 描述 符 由 和 包 des 参 数 给 出 。 可 以 访问 的 数据 量 
(QUARK) 由 len 参 数 设置 。 
你 可 以 通过 addr 参 数 来 请 求 使 用 某 个 特定 的 内 存 地 址 。 如 有 果 它 的 
取 值 是 零 ， 结 果 指 针 束 将 目 动 分 配 。 这 是 推荐 的 做 法 ， 否 则 会 降低 程 
序 的 可 移植 性 ， 因 为 不 同系 统 上 的 可 用 地 址 范围 是 不 一 样 的 。 
prot 参 数 用 于 设置 内 存 段 的 访问 权限 。 它 是 下 列 常数 值 的 按 位 OR 


PROT_READ: 人 允许 读 该 内 存 段 。 
PROT_WRITE: 人 允许 写 该 内 存 段 。 
PROT EXEC: 人 允许 执行 该 内 存 段 。 
PROT_NONE: 该 内 存 段 不 能 被 访问 。 
flags 参 数控 制程 序 对 该 内 存 段 的 改变 所 造成 的 影响 ， 可 以 使 用 的 
选项 如 表 3-7 所 示 。 


E 
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FILI. Je 修改 上 只 对 本 进 得 有 痪 
EA AAEE (4E Et 


msync 芳 数 的 作用 是 ， 把 在 该 内 存 段 的 某 个 部 分 或 整 段 中 的 修改 
写 回 到 被 映射 的 文件 中 (或 者 从 被 映射 文件 里 读 出 ) 。 


#include «sys/mman.h» 


int msync (void *addr, size t len, int flags); 
内 存 段 需要 修改 的 部 分 由 作为 参数 传递 过 来 的 起 始 地 址 addr 和 长 
o flags 参 数控 制 着 执行 修改 的 具体 方式 ， 可 以 使 用 的 选项 如 
3-8 及 不 。 


表 3-8 


munmap 函 数 的 作用 是 释放 内 存 段 : 


#include <sys/mman.h> 


int munmap(void *addr, size_t len); 
下 面 的 程序 mmap.c 演 示 了 如 何 利 用 mmap 和 数组 方式 的 存 取 操 作 
来 修改 一 个 结构 化 数据 文件 。 注 意 ，2.0 版 本 之 前 的 Linux 内 核 不 完全 
法 。 这 个 程序 在 Sun Solaris 和 其 他 操作 系统 上 也 能 
正确 运行 。 


x 验 fHimmapERZA 

(1) 我 们 先 定 义 一 个 RECORD 数 据 结 构 ， 然 后 创建 出 
NRECORDS 个 记录 ， 每 个 记录 中 保存 看 它们 各 目的 编号 。 然 后 把 这 些 
记录 都 追加 到 文件 records.dat 里 去 。 


Sinclude <unistd.h> 
#include <stdio.h> 
finclude <sye/rman.h> 
Sinclude «fcntl,.h» 
include <stdlib.h> 


typedef struct | 
int integer 
char string[24]; 
) RECORD; 


(define NRECORDS 1100] 


nt main 

E D rec app 

5 f; 

ILE *fp: 
fo lat w 
«0 i+ 
rec = 53 
spri d. string,’ RECORD- 
Íwritei&record,szizeof|record ACD 


(2) 接着 ， 我 们 把 第 43 条 记录 中 的 整数 值 由 43 修 改 为 143， 并 把 
它 写 人 入 第 43 条 记录 中 的 字 “EAR ° 


fp = topen(*records.dat*, “re 

teeek (fp. 43*sizoot{record SEEK SET) 
fresdi&record,sizeof(record!,l.fp!: 
recoré.integer = 14i; 


eprintt (record. atring, 'RECORD-*d* , record. integer); 


Peppy siete cer record) , SHEX_SET): 
fwritel&rec ,Bizeofirecord),1,fp!; 


(3) 现在 把 这 些 记录 映射 到 内 存 中 ， 然 后 访问 第 43 条 记录 ， 把 它 
Pot ee 〈 同 时 更 新 该 记录 中 的 字符 串 ) ， 使 用 的 还 是 内 存 
S 1 o 


r ja O_RDWR 
mapped = [RECORD *|mmap(0, MRECORDS*aizeof (record), 


FROT READ|PROT WRITE, MAP SHARED, f, 0) 


ae 43} .integer + 243; 
intf (mapped[4}) .atzing, *RECORD-t4° , mapped (43] . integer): 


meync|(iveid "'Jmapped, NRBCORDS*sizeof|record)], MS ASYNCII 
munmap((void *]mapped, NRECORDS*'sizeof(record)]! 
closge(f)!: 


2 EPLET, UME) Oh RSA GAUL: System VESA 
d.e 


3.12 小 结 


在 本 章 中 ， 你 学 习 了 Linux 提 供 的 直接 访问 文件 和 设备 的 方法 。 你 
看 到 了 建立 在 这 些 接 层 范 数 之 上 的 库 函 数 是 如 何 为 程序 设计 问题 提供 
灵活 的 解决 方案 的 。 现 在 ， 你 已 经 能 够 只 用 很 少儿 行 代 码 就 编写 出 功 
能 相当 强大 的 目录 扫描 例 程 了 。 

你 还 学 习 了 文件 和 目录 人 处理。 在 此 基础 之 上 ， 你 已 可 以 使 用 更 具 
结构 化 的 、 基 于 文件 的 解决 方案 将 在 第 2 章 最 后 编写 的 初级 的 CD 唱片 
应 用 程序 转换 为 一 个 C 语 言 程 序 了 。 但 目前 你 还 无 法 给 这 个 程序 增加 
新 的 功能 ， 所 以 对 整个 程序 的 重 写 工作 将 推迟 到 你 学 习 了 如 何 处 理 屏 
幕 显示 和 键盘 输入 之 后 再 进行 ， 而 这 些 内 容 正 是 接 下 来 两 草 的 主题 。 


第 4 章 Linux 环 境 


E 为 Linux (或 UNIX 和 类 UNIX 系 统 ) 编写 程序 时 ， 你 必须 考虑 
到 程序 将 在 一 个 多 任务 环境 中 运行 。 这 意味 着 在 同一 时 间 会 有 多 个 程 
序 运行 ， 它 们 共享 内 存 、 位 副 空 间 和 CPU 周 期 等 机 器 资源 。 甚 至 同一 
程序 也 会 有 多 个 实例 同时 运行 。 最 重要 的 是 ， 这 些 程序 能 够 互 不 干 
扰 ， 能 够 了 解 它 们 的 环境 ， 并 且 能 正确 运行 ， 不 产生 冲突 〈 例 如 ， 试 
图 与 其 他 程序 同时 写 同 一 个 文件 ) 。 

在 本 章 中 ， 我 们 将 介绍 程序 运行 的 环境 ， 程 序 如何 通 过 环境 来 获 
得 有 关 其 运行 条 件 的 信息 ， 以 及 用 户 怎 样 改变 程序 的 行为 。 我 们 将 重 


点 介绍 以 下 内 容 : 
Oo “向 程序 传递 参数 
口 环境 变量 
o 查看 时 间 
Hj 临时 文件 
OD “获得 有 关 用 户 和 主机 的 信息 
O 生成 和 配置 日 志 信 息 
口 了 解 系统 各 项 资源 的 限制 


41 程序 参 


当 一 个 用 C 语 言 编 写 的 Linux 或 UNIX 程 序 运行 时 ， 它 是 从 main 范 
数 开始 的 。 对 这 些 程序 而 言 ，main 函 数 的 声明 如 下 所 示 : 


int main(int argc, char *argv[]) 


其 中 argc 是 程序 参数 的 个 数 ，argv 是 一 个 代表 参数 目 身 的 字符 串 数 组 。 
你 可 能 也 会 看 到 Linux 的 C 程 序 将 main 函 数 簿 单 的 声明 为 : 


main () 


这 样 也 行 ， 因 为 默认 的 返回 值 类 型 是 int， 而 且 函 数 中 不 用 的 形式 
oe 。 argc 和 argv 仍 在 ， 但 如 果 不 声 明 它 们 ， 你 就 不 能 使 用 
它们 。 

无 论 操 作 系统 何 时 局 动 一 个 新 程序 ， 参 数 argc 和 argv 都 被 设置 并 传 
递 给 main。 这 些 参数 通 铝 由 另 一 个 程序 提供 ， 这 个 程序 一 般 是 shell， 
它 要 求 操作 系统 启动 该 新 程序 。shell 接 受用 户 输入 的 命令 行 ， 将 命令 
行 分 解 成 单词 ， 然 后 把 这 些 单词 放 入 argv 数 组 。 请 记 住 : Linux 的 shell 
一 般 会 在 设置 argc 和 argv 之 前 对 文件 名 参数 进行 通配符 扩展 ， 而 MS- 
DOS 的 shell 则 期 望 程序 接受 带 通 配 符 的 参数 ， 并 执行 它们 自己 的 通 配 


符 扩 展 。 
例如 ， 如 果 我 们 给 shell 输 入 如 下 命令 : 
$ myprog left right ‘and center' 
程序 myprog 将 从 main 函 数 开始 ，main 市 的 参数 是 : 


注意 ， 参 数 个 数 包括 程序 名 自身 ，argv 数 组 也 包含 程序 名 并 将 它 
作为 第 一 个 元 素 argv[0]。 因 为 我 们 在 shell 命 令 里 使 用 了 引号 ， 所 以 第 
四 个 参数 是 一 个 包含 了 空格 的 字符 串 。 

如 果 你 用 ISO/ANSI C 语 言 编 写 过 程序 ， 就 会 对 上 面 的 这 些 很 熟 
悉 。main 的 参数 对 应 shell 脚 本 里 的 位 置 参数 $0、$1 等 。ISO/ANSIC 只 
oe 回 int， 而 X/Open 规 范 则 早已 给 出 了 如 上 上 所 示 的 明确 声 
HH o 

命令 行 参 数 在 回程 序 传递 信息 方面 是 很 有 用 的 。 例 如 ， 我 们 可 以 
在 一 个 数据 库 应 用 程序 中 使 用 命令 行 参 数 来 传递 想 用 的 数据 库 的 名 


字 ， 这 样 吏 可 以 在 多 个 数据 库 上 使 用 同一 个 程序 。 许 多 工具 程序 也 使 
用 命令 行 参数 来 改变 程序 的 行为 或 设置 选项 。 通 第 ， 你 可 以 使 用 一 个 
以 短 横 线 C) 开头 的 命令 行 参数 来 设置 这 些 所 谓 的 标志 (flag BF 
X (switch) 。 例 如 ，sort 程 序 可 以 用 一 个 开关 来 进行 逆向 排序 (与 正 
常 排序 相反 ) : 


S sort -r file 


命令 行 选项 很 常用 ， 因 此 按 相 同 的 方式 使 用 它们 对 程序 的 使 用 者 
来 说 是 很 有 好 处 的 。 过 去 ， 每 个 工具 程序 采用 它们 各 自 的 方式 来 使 用 
命令 行 选项 ， 这 带 来 了 一 些 混乱 。 例 如 ， 请 看 下 面 这 些 命令 使 用 参数 
的 方式 : 
$ tar cvfB /tmp/file.tar 1024 
5 dd if=/dev/fd0 ofz/tmp/file.dd bs=18k 
S En --help 
S ls -lstr 
S ls -l -s -t -r 
我 们 建议 在 应 用 程序 中 ， 所 有 的 命令 行 开 关 都 应 以 一 个 短 横 线 开 
涉 ， 其 后 包含 单个 字母 或 数字 。 如 果 需 要 ， 不 带 后 续 参 数 的 选项 可 以 
在 一 个 短 横 线 后 归并 到 一 起 。 所 以 ， 上 面 的 两 个 Is 命 令 示例 就 遵循 了 
以 上 准则 。 如 采 某 个 选项 需要 值 ， 则 该 值 应 作为 独立 的 参数 紧 跟 在 该 
选项 后 。dd 命 令 示例 违背 了 这 一 准则 ， 因 为 它 使 用 了 多 字符 的 选项 ， 
而 且 选 项 未 以 短 横 线 开 头 (if=/dev/fd0) ， 而 tar 命 令 则 把 选项 和 它们 
的 值 完全 分 开 ! 我 们 建议 最 好 能 为 单字 符 开 关 增 加 一 个 更 长 的 、 更 有 
意义 的 开关 和 名， 这样 你 瓯 可 以 使 用 -h 或 --help 选 项 来 获得 帮助 了 。 
有 些 程序 还 有 一 个 奇怪 的 地 方 ， 就 是 用 选项 +x (举例 来 说 执行 
与 -x 相 反 的 功能 。 例 如 ， 在 第 2 章 中 ， 我 们 使 用 命令 set-oxtrace 来 设置 
shell 执 行 跟踪， 使 用 命令 set+o xtrace 来 关闭 它 。 
撤 开 风格 各 异 的 语法 格式 不 谈 ， 单 是 记 住 所 有 这 些 程 序 选 项 的 顺 
序 和 含义 就 已 经 非常 困难 了 。 通 常 ， 你 只 有 求助 于 -h (帮助 ) 选项 或 
man 手 册页 (如 果 程 序 员 提供 了 的 话 ) 。 你 将 在 本 章 稍 后 看 到 ，getopt 
提供 了 对 这 些 问题 的 一 个 优雅 的 解决 方案 。 不 过 现在 ， 我 们 还 是 先 看 
看 传递 到 程序 中 的 参数 是 怎样 处 理 的 。 


x k 程序 参数 
下 面 这 个 程序 argsc 对 其 参数 进行 检查 ， 


当 运 行 这 个 程序 时 ， 它 只 是 打印 其 参数 和 发 现 的 选项 。 我 们 的 总 
图 是 ， 让 该 程序 接受 一 个 字符 串 参 数 和 一 个 由 -f 选 项 引入 的 可 选 的 文 
件 名 参数 。 其 他 的 选项 也 可 以 被 定义 。 


实验 解析 

这 个 程序 利用 计数 参数 argc 建 立 一 个 循环 来 检查 所 有 的 程序 参 
数 。 它 通过 检查 首 字 母 是 否 是 短 横 线 米 发 现 选 项 。 

在 本 例 中 ， 如 果 打 算 文 持 -1 选项 和 -r 先 项， 那么 我 们 束 忽 略 了 一 个 
事实 : -选项 应 该 和 -1 -r 一 样 处 理 。 

X/Open 规范 (可 以 在 http://opengroup.org/ 上 找到 ) 定义 了 命令 行 
选项 的 标准 用 法 〈 工 具 语法 指南 ) ， 同 时 定义 了 在 C 语 言 程序 中 提供 
命令 行 开 关 的 标准 编程 接口 : getopt 函 数 。 


4.1.1 getopt 


为 了 帮助 我 们 遵循 这 些 准则 ，Linux 提 供 了 getopt 函 数 ， 它 支持 需 
要 关联 值 和 不 需要 关联 值 的 选项 ， 而 且 们 单 易 用 。 


> ./args -i -lr 'hi there' -f fred.c 


argument 3: hi there 


argument 


getopt 函 数 将 传递 给 程序 的 main 函 数 的 argc 和 argv 作 为 参数 ， 同 时 
接受 一 个 选项 指定 符 字 符 串 optstring， 该 字符 串 告 诉 getopt 哪 些 选项 可 
用 ， 以 及 它们 是 否 有 关联 值 。optstring 只 是 一 个 字符 列表 ， 每 个 字符 
代表 一 个 单字 符 选 项 。 如 果 一 个 字符 后 面 紧 跟 一 个 冒号 (:) ， 则 表明 


该 选项 有 一 个 关联 值 作为 下 一 个 参数 。bash 中 的 getopts 命 令 执行 类 似 
的 功能 。 
例如 ， 我 们 可 以 用 下 面 的 调用 来 处 理 上 面 的 例子 : 


int getopt(int argc, char *const argv[], const char *optstring); 
extern char *optarg; 
extern int optind, opterr, optopt; 


它 人 允许 几 个 简单 的 选项 ，-i、-1、-r 和 -f， 其 中 -f 选 项 后 要 紧 跟 一 个 
文件 名 参数 。 使 用 相同 的 参数 ， 但 以 不 同 的 顺序 来 调用 命令 将 改变 程 
序 的 行为 。 你 可 以 在 本 章 的 下 一 个 实验 部 分 进行 洗 试 。 

getopt 的 返回 值 是 argv 数 组 中 的 下 一 个 选项 字符 (如 果 有 的 话 ) 
循环 调用 getopt 就 可 以 依次 得 到 每 个 选项 。getopt 有 如 下 行为 。 

o “如 果 选 项 有 一 个 关联 值 ， 则 外 部 变量 optarg 指 回 这 个 值 。 

O “如 果 选 项 处 理 完毕 ，getopt 返 回 -1， 特 殊 参 数 -- 将 使 getopt 停 目 

扫 摘 选项 。 

o 如 果 遇 到 一 个 无 法 识别 的 选项 ，getopt 返 回 一 个 问号 (?) , 

并 把 它 保存 到 外 部 变量 optopt 中 。 

o “如 果 一 个 选项 要 求 有 一 个 关联 值 (例如 例子 中 的 -f) ， 但 用 户 

并 未 提供 这 个 值 ，getopt 通 常 将 返回 一 个 问号 (?) 。 如 果 我 们 将 

选项 字符 串 的 第 一 个 字符 设置 为 冒号 (:) ， 那 么 getopt 将 在 用 户 

未 提供 值 的 情况 下 返回 冒号 6) 而 不 是 问号 (?) 

外 部 变量 optind 被 设置 为 下 一 个 竺 处理 参数 的 索引 。getopt 利 用 它 
来 记录 目 己 的 进度 。 程 序 很 少 需要 对 这 个 变量 进行 设置 。 当 所 有 选项 
参数 都 处 理 完毕 后 ，optind 将 指 癌 argv 数 组 尾部 可 以 找到 其 余 参 数 的 位 
置 o 


有 些 版 本 的 getopt 会 在 第 一 个 非 选项 参数 处 停 下 来 ， 返 回 -1 并 设置 
optind 的 值 。 而 其 他 一 些 版 本 ， 如 Linux 提 供 的 版 本 ， 能 够 处 理 出 现在 
程序 参数 中 任意 位 置 的 选项 。 注 意 ， 在 这 种 情况 下 ，getopt 实 际 上 重 写 
了 argv 数 组 ， 把 所 有 非 选 项 参数 都 集中 在 一 起 ， 从 argv[optind] 位 置 开 
始 。 对 GNU 版 本 的 getopt 而 言 ， 这 一 行为 是 由 环境 变量 
POSIXLY_CORRECT 控 制 的 ， 如 有 果 它 被 设置 ，getopt 束 会 在 第 一 个 非 
选项 参数 处 停 下 来 。 此 外 ， 还 有 些 getopt 版 本 会 在 遇 到 未 知 选项 时 打印 
出 错 信 息 。 注 意 ， 根 据 POSIX 规 范 的 规定 ， 如 果 opterr 变 量 是 非 零 值 ， 
getopt 就 会 向 stderr 打 印 一 条 出 错 信息 。 


实 验 getopt Hal 


TEX SCA rp, (CRETE "P EF getopt, JT RESTER f 45 2 


argopt.c: 


pti 1 
printf[*argument: *a'in" 


"dn 当 运 行 这 个 程序 时 ， 你 将 发 现 所 有 命令 行 参数 都 被 目 动 处 
RET. 


$ ./argopt -i -lr 'hi there' -f fred.c -q 


nar ‘ =, 1 
lame 
^ tum 


ime ere 


实验 解析 
这 个 程序 循环 调用 getopt 对 远 项 参数 进行 处 理 ， 直 到 处 理 完毕 ， 此 
时 getopt 返 回 -1。 每 个 选项 《包括 未 知 选项 和 缺少 关联 值 的 选项 ) 都 有 
相应 的 处 理 动作 。 根 据 使 用 的 getopt 版 本 ， 你 看 到 的 输出 可 能 和 上 面 显 
示 的 略 有 不 同 ， 巨 其 是 出 错 信 息 部 分 ， 但 含义 都 征明 确 的 。 
当 所 有 选项 都 处 理 完毕 后 ， 程 序 像 以 前 一 样 把 其 余 参 数 都 打印 出 
来 ， 但 这 次 是 从 optind 位 置 开始 。 


4.1.2 getopt long 


许多 Linux 应 用 程序 也 接受 比 我 们 在 前 面 例子 中 所 用 的 单字 符 选 项 
含义 更 明确 的 参数 。GNU C 画 数 库 包 含 getopt 的 另 一 个 版 本 ， 称 作 
getopt long， 它 接受 以 双 划 线 (--) 开始 的 长 参数 。 


X 验 getopt long 
你 可 以 使 用 getopt long 创建 一 个 新 版 本 的 示例 程序 ， 它 可 以 使 用 
与 前 面 选项 等 效 的 长 参数 选项 ; 


$ ./longopt --initialize --list ‘hi there' --file fred.c -q 


事实 上 ， 新 的 长 选项 和 原来 的 单字 符 选项 可 以 混合 使 用 。 只 要 它 
们 能 够 被 区 分 开 ， 长 选项 也 可 以 缩写 。 有 关联 值 的 长 选项 可 以 按照 格 
式 --option=value 作 为 单个 参数 给 出 ， 如 下 所 示 : 


5 ./longopt --init -l --filesfred.c 'hi there' 
option: 
option: 1 


新 程序 longoptc 如 下 所 示 ， 其 中 ， 以 阴影 显示 的 部 分 为 支持 长 选 
项 而 对 argopt.c 所 做 的 修改 : 


#include <stdio.h> 
#include <unistd.h> 


PRA 


pti 


实验 解析 

getopt_long 嘛 数 比 getopt 多 两 个 参数 。 第 一 个 附加 参数 是 一 个 结构 
数组 ， 它 摘 述 了 每 个 长 选项 并 告诉 getopt_long 如 何 处 理 它 们 。 第 二 个 
附加 参数 是 一 个 变量 指针 ， 它 可 以 作为 optind 的 长 选项 版 本 使 用 。 对 
于 每 个 识别 的 长 选项 ， 它 在 长 选项 数组 中 的 索引 束 写 入 该 变量 。 在 本 
例 中 ， 你 不 需要 这 一 信息 ， 因 此 第 二 个 附加 参数 是 NULL © 

长 选项 数组 由 一 些 类 型 为 struct option 的 结构 组 成 ， 每 个 结构 摘 述 
了 一 个 长 选项 的 行为 。 该 数组 必须 以 一 个 包含 全 0 的 结构 结尾 。 

长 选项 结构 在 头 文 件 getopth 中 定义 ， 并 且 该 头 文 件 必 须 与 常量 
_GNU_SOURCE 一 同 包含 进来 ， 该 常量 启用 getopt_ Jong 功 能 。 


struct option { 
const char *name; 
int has_arg; 
int *flag; 


int val; 
H 
该 结构 的 成 员 如 表 4-1 所 示 。 


表 4-1 


RARA 说 y 
m King. SUES, UC ORAN AR 
iRa3gNTSQTQ. 0X 4*58.1Eg4446( THK. LAAT ttet 
QE nul SRABRMN., getopt jii I CER bua: WE A 
propt longigo, Fe MAGA racine es 


pt long idR T EL I) o 


要 了 解 GNU 对 getopt 扩 展 的 其 他 选项 及 相关 画 数 ， 请 参考 getopt 的 
手册 页 。 


4.2 ^E 


我 们 在 第 2 章 讨论 过 环境 变量 。 这 是 一 些 能 用 来 控制 shell 脚 本 和 其 
他 程序 行为 的 变量 。 你 还 可 以 用 它们 来 配置 用 户 环境 。 例 如 ， 每 个 用 
尸 有 一 个 环境 变量 HOME， 它 定义 了 用 户 的 家 目录 ， 即 该 用 户 会 话 的 
黑 认 开始 位 置 。 正 如 你 已 看 到 的 ， 你 可 以 在 shell 提 示 符 中 检查 环境 变 
R. 


$ echo $HOME 
/home/neil 


你 也 可 以 使 用 shel 的 set 命 令 来 列 出 所 有 的 环境 变量 o 

UNIX 规 范 为 各 种 应 用 定义 了 许多 标准 环境 变量 ， 包 括 终 端 类 型 、 
默认 的 编辑 右 、 时 区 等 。C 语 言 程序 可 以 通过 putenv 和 getenv 函 数 来 访 
问 环 境 变量 。 


#include <stdlib.h> 


char *getenv(const char *name); 
int putenv(const char *string); 


环境 由 一 组 格式 为 “名 字 = 值 > 的 字符 串 组 成 。getenv 函 数 以 给 定 的 
名 字 搜 索 环境 中 的 一 个 字符 串 ， 并 返回 与 该 名 字 相 关 的 值 。 如 果 请 求 
的 变量 不 存在 ， 它 就 返回 null。 如 果 变 量 存 在 但 无 关联 值 ， 它 将 运行 
成 功 并 返回 一 个 空 字符 串 ， 即 该 字符 串 的 第 一 个 字 节 是 null。 由 于 
getenv 返 回 的 字符 串 是 存储 在 getenv 提 供 的 静态 空间 中 ， 所 以 如 果 想 进 
一 步 使 用 它 ， 你 就 必须 将 它 复制 到 另 一 个 字符 串 中 ， 以 免 它 被 后 续 的 
getenv 调 用 所 履 盖 。 

putenv 函 数 以 一 个 格式 为 “名 字 = 值 > 的 字符 串 作 为 参数 ， 并 将 该 字 
符 串 加 到 当前 环境 中 。 如 果 由 于 可 用 内 存 不 足 而 不 能 扩展 环境 ， 它 会 
失败 并 返回 -1。 此 时 ， 错 误 变 量 ermo 将 被 设置 为 ENOMEM ° 

在 下 面 的 实验 中 ， 你 将 编写 一 个 程序 来 打印 所 选 的 任意 环境 变量 
的 值 。 如 果 给 程序 传递 第 二 个 参数 ， 你 还 将 设置 环境 变量 的 值 。 


X 验 getenv 和 putenv 
(1) 紧 接 在 main 函 数 声 明 后 的 几 行 代 码 用 于 确保 程序 environ.c 被 
正确 调用 ， 它 只 带 有 一 个 或 两 个 参数 : 


(2) 然后 ， 调 用 getenv 从 环境 中 取出 变量 的 值 : 


finciude <string.h> 
int main(int argc, char *argv(1! 
( 


char *var, *value 


argc l ar | 
tprinttisetderr, “usage: environ var 1Y6106 0 |) 
exit 


(3) 接 下 来 ， 检 查 程序 调用 时 是 否 有 第 二 个 参数 。 如 果 有 ， 则 通 
过 构造 一 个 格式 为 “名 字 = 值 ”的 字符 串 并 调用 putenv 来 设置 变量 的 值 : 


var = argv[i]; 
value = getenv (var) 
if (value) 
printf (‘Variable ts has value ts\n*, var, value 
else 


(4) 最 后 再 次 调用 getenv 来 查看 赤 量 的 新 值 : 


char *string; 

valus = argvi2]! 

string = mallocistrlen(var)estrien(value]*2]: 

if(istring) ( 
fprintf[stderrz,"out of memory\n*) 
exit(l); 

} 

strcpy (string, var 

etrcat(atring, *=")7 

sa s value) 

print Calling puteny with: ta\n" string); 

if pd pe ing} t= 0) [ 
fprintf(stderr,"putenv failed\n*) 
free(string);: 
exitiili 


) 


运行 这 个 程序 ， 你 可 以 查看 和 修改 环境 变量 : 


value * getenv(var); 
iftvalue) 

printf|*New value of te is Wein", var, value); 
else 

printf|*New value of ts is null??Wn', var): 


$ ./environ FRED 

Variable FRED has no value 

$ ./environ FRED hello 

Variable FRED has no value 
Calling putenv with: FRED=hello 
New value of FRED is hello 

$ ./environ FRED 

Variable FRED has no value 


注意 : 环境 仅 对 程序 本 身 有 效 。 你 在 程序 里 做 的 改变 不 会 反 
映 到 外 部 环境 中 ， 这 是 因为 变量 的 值 不 会 从 子 进程 〈 你 的 程序 ) 
传播 到 父 进程 (shell) 。 


4.2.1 ERE HA] A RS 


程序 经 常 使 用 环境 变量 来 改变 它们 的 工作 方式 。 用 户 可 以 通过 以 
下 方式 设置 环境 变量 的 值 : 在 默认 环境 中 设置 、 通 过 登录 shell 读 取 
的 。 使 用 shell 专 用 的 启动 文件 (rc) 或 在 shell 命 令 
行 上 对 变量 进行 设 定 。 例 如 ; 


$ ./environ FRED 
Variable FRED has no value 
$ FRED-hello ./environ FRED 
Variable FRED has value hello 
shell 将 行 首 的 变量 赋值 作为 对 环境 变量 的 临时 改变 。 在 上 面 的 第 
二 个 例子 中 ， 程 序 environ 将 运行 在 一 个 变量 FRED 有 一 个 赋值 的 环境 
中 。 


举 个 例子 ， 在 CD 数据 库 应 用 程序 的 未 来 版 本 中 ， 你 可 以 通过 改变 
一 个 环境 变量 ， 比 如 CDDB ， 来 指定 所 用 的 数据 库 。 这 样 ， 每 个 用 户 
束 能 指定 目 己 的 默认 值 ， 或 者 在 每 次 运行 时 使 用 shell 命 令 来 设 定 : 
$ CDDB=mycds; export CDDB 
$ cdapp 


x 
或 


$ CDDB=mycds cdapp 


环境 变量 是 一 把 双 刃 剑 ， 使 用 它 的 时 候 要 小 心 ! 与 命令 行 选 
项 相 比 ， 它 们 对 用 户 来 说 更 加 “隐蔽 ”， 这 样 惑 使 得 程序 的 调试 变 
得 更 加 困难 。 从 某 种 意义 上 来 说 ， 环 境 变量 就 像 全 局 变量 一 样 ， 
它们 会 改变 程序 的 行为 ， 产 生 不 可 预期 的 结果 。 


4.2.2 environ 变量 


正如 你 已 看 到 的 ， 程 序 的 环境 由 一 组 格式 为 “名 字 = 值 ”的 字符 串 组 
成 。 程 序 可 以 通过 environ 变 量 直 接 访问 这 个 字符 串 数 组 。environ 变 量 


的 声明 如 下 所 示 : 
#include <stdlib.h> 


extern char **environ; 


X 验 environ? E 
下 面 这 个 程序 showenv.c 使 用 environ 变 量 打印 环境 变量 : 


#include <stdlib.h> 
#include <stdio.h> 


当 在 Linux 系 统 运行 该 程序 时 ， 你 将 得 到 如 下 的 输出 〈 略 做 删 
减 ) 。 这 些 变量 的 数目 、 出 现 顺序 和 值 取 决 于 操作 系统 的 版 本 、 所 用 


的 shell 以 及 程序 运行 时 的 用 户 设置 。 


./showenv 
HOSTNAME-tilde.provider.com 


LS OPTIONS--N --color=tty -T 0 


SHELL=/bin/bash 
OSTYPE=Linux 


实验 解析 
这 个 程序 遍历 environ 变 量 (一 个 以 null 结 尾 的 字符 串 数组 ) 
打印 出 整个 环境 。 


4.3 时 间 和 日 


通 利 能 确定 时 间 和 日 期 对 一 个 程序 来 说 是 非常 有 用 的 。 程 序 可 能 
记录 它 运行 的 时 间 ， 或 者 可 能 需要 在 某 些 时 候 改 变 它 的 运行 方 
7 1， 一 个 游戏 可 能 拒绝 在 工作 时 间 运 行 ， 或 者 一 个 定时 备份 程 
序 可 能 想 等 到 每 天 的 凑 晨 才 开始 一 个 目 动 备份 。 


所 有 的 UNIX 系 统 都 使 用 同一 个 时 间 和 日 期 的 起 点 : 格林 尼 治 
时 间 (GMT) 1970 年 1 月 1 日 午夜 (0 点 ) 。 这 是 “UNIX 纪 元 的 起 
点 ”，Linux 也 不 例外 。Linux 系 统 中 所 有 的 时 间 都 以 从 那 时 起 经 过 
的 秒 数 来 衡量 。 这 和 MS-DOS 处 理 时 间 的 方法 类 似 ， 只 是 MS- 
DOS 纪 元 始 于 1980 年 。 其 他 系统 使 用 其 他 的 纪元 起 始 时 间 。 


时 间 通 过 一 个 预定 义 的 类 型 time t 来 处 理 。 这 是 一 个 大 到 能 够 容 
纳 以 秒 计 算 的 日 期 和 时 间 的 整数 类 型 。 在 Linux 系 统 中 ， 它 是 一 个 长 整 
型 ， 与 处 理 时 间 值 的 函数 一 起 定义 在 头 文件 time.h 中 。 


绝 不 要 想当然 地 以 为 ， 时 间 就 是 32 位 的 。 在 使 用 32 位 time t 
类 型 的 UNIX 和 Linux 系 统 中 ， 时 间 将 在 2038 年 回 绕 。 到 那 时 ， 我 
们 希望 系统 都 开始 使 用 大 于 32 位 的 time_t 类 型 。 随 着 最 近 64 位 处 
理 器 进入 主流 处 理 嚣 市场， 这 一 趋势 几乎 是 必然 的 。 


#include <time.h> 


time t time(time t *tloc); 


fi nT DAS E VR] time ER 238-8] JJ BENE EÉ, “EIA ce Meco 
开始 至 今 的 秒 数 。 如 有 果 tloc 不 是 一 个 空 指针 ，time 函 数 还 会 把 返回 值 写 
入 tloc 指 针 指 同 的 位 置 。 


x 验 time 
“Pk al A FE envtime.cii7as T time KAHE: 


运行 这 个 程序 ， 它 会 在 20 秒 时 间 内 每 两 秒 钟 打印 一 次 底层 的 时 间 
值 。 


$ ./envtime 
The time is 1179643852 
The time is 1179643854 
The time is 1179643856 
The time is 1179643858 
The time is 1179643860 
The time is 1179643862 
The time is 1179643864 
The time is 1179643866 
The time is 1179643868 
The time is 1179643870 
实验 解析 
这 个 程序 用 一 个 空 指针 参数 调用 time 函 数 ， 返 回 以 秒 数 计算 的 时 
则 和 日 期 。 程 序 休眠 两 秒 后 再 重复 调用 time 函 数 ， 总 共 调 用 10 次 。 
以 从 1970 年 开始 计算 的 秒 数 来 表示 时 间 和 日 期 ， 对 测算 某 些 事 情 
寺 续 的 时 间 是 很 有 用 的 。 你 可 以 把 它 考 虑 为 简 单 地 把 两 次 调用 time 得 
到 的 值 相 减 。 然 而 TSO/ANSIC 标 准 委员 会 经 过 审议 ， 并 没有 规定 用 
time t 类 型 来 测量 任意 时 间 之 间 的 秒 数 ， 他 们 发 明了 一 个 函数 
difftime， 该 函数 用 来 计算 两 个 time_t 值 之 间 的 秒 数 并 以 double 类 型 返回 
它 。 


#include <time.h> 


double difftime(time t timel, time t time2); 


difftime 芳 数 计算 两 个 时 间 值 之 间 的 差 ， 并 将 time1l-time2 的 值 作为 
浮 点 数 返回 。 对 Linux 来 说 ，time 画 数 的 返回 值 是 一 个 易于 处 理 的 各 
数 ， 但 考虑 到 最 大 限度 的 可 移植 性 ， 你 最 好 使 用 difftime 。 

为 了 提供 (对 人 类 ) 更 有 意义 的 时 间 和 日 期 ， 你 需要 把 时 间 值 转 
换 为 可 读 的 时 间 和 日 期 。 有 一 些 标准 函数 可 以 帮 有 我 们 做 到 这 一 点 。 
2 6 该 结构 包含 一 些 常用 

» Dl: 


#include <time.h> 
struct tm *gmtime(const time_t timeval); 


tm 结构 被 定义 为 至 少 包含 表 4-2 所 示 的 成 员 。 
表 4-2 


tal 5 i i 


tm secl) 16 E] fe Fa] |] AD BIE] BD 


x 4 gmtimeER2A 
: "t s d p 出 当前 时 间 
HAH: 


Sincluce «sati: je 


struct tm *tm ptr; 


运行 这 个 程序 ， 你 将 得 到 含义 明显 的 时 间 和 日 期 : 
S ./gmtime; date 


Raw time is 1179644196 


ahd ae f- 
0:20:50 
YU 


~ 
Si Mav 20 07-56-27 cm ?nn7 
oun May < 07:56:37 BST 2007 


实验 解析 

这 个 程序 调用 time 函 数 得 到 底层 的 时 间 值 ， 然 后 调用 gmtime 将 该 
值 转换 为 一 个 包含 有 用 的 时 间 和 日 期 值 的 结构 。 最 后 ， 程 序 用 printf 将 
这 些 信息 打印 出 来 。 严 格 来 说 ， 你 不 应 该 用 这 种 方法 打印 原始 时 间 
值 ， 因 为 我 们 并 不 能 保证 EEA RULES Elong A HUIB e 我 们 在 
运行 gmtime 程 序 后 立即 运行 date 命 令 以 比较 它们 的 输出 。 

不 过 ， 这 儿 有 个 小 问题 。 如 果 在 格林 尼 治 标准 时 间 (GMT) 之 外 
的 时 区 运行 这 个 程序 ， 或 者 所 在 的 地 方 像 本 例 中 那样 采用 了 夏令 时 ， 
你 会 发 现时 间 (可 能 还 有 日 期 是 不 对 的 。 这 是 因为 gmtime 按 GMT 返 
回 时 间 (现在 GMT 被 称 为 世界 标准 时 间 ， 或 UTC) 。Linux 和 UNIX 这 
样 做 是 为 了 同步 全 球 各 地 的 所 有 程序 和 系统 。 不 同时 区 同一 时 刻 创建 
oe 会 有 相同 的 创建 时 间 。 要 看 当地 时 间 ， 你 需要 使 用 localtime 


#include <time.h> 


struct tm *localtime(const time t *timeval); 


localtime EX X flgmtime— TE, R T EDR EIN PASAT 
据 当 地 时 区 和 有 是否 采用 夏令 时 做 了 调整 。 如 果 把 上 面 程序 中 的 gmtime 
换 成 localtime， 再 编译 运行 一 次 ， 你 就 会 看 到 正确 的 时 间 和 日 期 了 。 

要 把 已 分 解 出 来 的 tm 结构 再 转换 为 原始 的 time_t 时 间 值 ， 你 可 以 
fii H mktime Ký: 


#include <time.h> 


time t mktime(struct tm *timeptr) ; 


如 果 tm 结 构 不 能 被 表示 为 time_t 值 ，mktime 将 返回 -1。 
为 了 得 到 更 “友好 ”的 时 间 和 日 期 表示 ， 像 date 命 令 输 出 的 那样 ， 
你 可 以 使 用 asctime 函 数 和 ctime 函 数 : 


#include <time.h> 


char *asctime(const struct tm *timeptr); 
char *ctime(const time t *timeval); 


asctime ER ZA [B] — i HB, "E Atm 28 timeptr Hr A Hi AYA 
间 和 日 期 。 这 个 返回 的 字符 串 有 类 似 下 面 的 格式 : 


Sun Jun 9 12:34:56 2007\n\0 


E eS PRE AI 26 7 FFF AI EAST © ctime BSE RCT al AD 
HDAN ER C: 


它 以 原始 时 间 值 为 参数 ， 并 将 它 转换 为 一 个 更 易 读 的 本 地 时 间 。 


x 验 ctimeENZA 
TEAS AAR, EF RTS RAS KE Ar ctim WALA AE: 


译 并 运行 这 个 ctime.c 程 序 ， 你 将 看 到 如 下 所 示 的 输出 : 


Sr 


$ ./ctime 
The date is: Sat Jun 9 08:02:08 2007 
实验 解析 
ctime.c 程 序 调 用 time 函 数 得 到 底层 时 间 值 ， 让 ctime 做 所 有 的 艰巨 
工作 ， 把 时 间 值 转换 成 可 读 的 字符 串 ， 然 后 打印 它 。 
为 了 对 时 间 和 日 期 字符 串 的 格式 有 更 多 控制 ，Linux 和 现代 的 类 
UNIX 系 统 提 供 了 strftime 函 数 。 它 很 像 是 一 个 针对 时 间 和 日 期 的 sprintf 
函数 ， 工 作 方式 也 很 类 似 : 


finclude «time.h» 


strftime EX BU z f timeptrTR ET T8 [8] B tm £5 T zs YAY Ta] HI 
HH, FPR AREF AT RSH o APR tame (ED) maxsize 个 字符 
K ° format 4j RASH 55 ACE TI RSH FT o Spritt tF, CAE 
将 被 传 给 字符 串 的 普通 字符 和 用 于 格式 化 时 间 和 日 期 元 系 的 转换 控制 
符 。 转 换 控制 符 见 表 4-3。 


表 4-3 


41103377 


本 因此 ，date 命 令 输出 的 普通 日 期 束 相 当 于 strftime 格 式 子 符 串 中 


"Sa tb $d %H:%M:%S BY" 


为 了 读 取 日 期 ， 你 可 以 使 用 strptime 画 数 ， 该 函数 以 一 个 代表 日 期 
和 时 间 的 字符 串 为 参数 ， 并 创建 表示 同一 日 期 和 时 间 的 tm 结构 : 


char *strptime(const char *buf, const char *format, struct tm *timeptr); 


format 字 符 串 的 构建 方式 和 strftime 的 format 字 符 串 完全 一 样 。 
strptime 在 字符 串 扫 擅 方面 类 似 于 sscanf 函 数 ， 也 是 查找 可 识别 字段 ， 
并 把 它们 写 入 对 应 的 变量 中 。 只 是 这 里 是 根据 format 字 人 符 串 来 填充 tm 
结构 的 成 员 。 不 过 ，strptime 的 转换 控制 符 与 strftime 的 相 比 ， 限 制 要 稍 
微 松 一 些 ， 因 为 strptime 中 的 星期 几 和 月 份 用 缩写 和 全 称 都 行 ， 两 者 都 
匹配 strptime 中 的 %a 探 制 符 ， 此 外 ，strftimne 对 小 于 10 的 数字 总 以 0 开 
头 ， 而 strptime 则 把 它 看 作 是 可 选 的 。 

strptime 返 回 一 个 指针 ， 指 向 转换 过 程 处 理 的 最 后 一 个 字符 后 面 的 
那个 字符 。 如 果 碰 到 不 能 转换 的 字符 ， 转 换 过 程 就 在 该 处 停 下 来 。 调 
用 程序 需要 检查 是 否 已 从 传递 的 字符 串 中 读 入 了 足够 多 的 数据 ， 以 确 
保 tm 结构 中 写 入 了 有 意义 的 值 。 


x 验  strftime A AMstrptime HA 
请 留意 下 面 这 个 程序 中 选用 的 转换 控制 符 : 


tine 


编译 并 运行 这 个 程序 strftime.c， 你 将 得 到 |: 


> ./strftime 
tritime give 


实验 解析 
strftime 程 序 通 过 调用 time 和 ]localtime 得 到 当前 的 本 地 时 间 。 然 

， 它 通过 调用 市 有 合适 的 格式 参数 的 strftime 将 时 间 转 换 成 可 读 的 格 
。 为 演示 strptime 的 用 法 ， 程 序 构 建 了 一 个 包含 日 斯 和 时 间 的 字符 
， 然 后 调用 strptime 将 原始 时 间 和 日 期 值 提取 并 打印 出 来 。 转 换 控 制 
符 %R 是 strptime 中 对 %H:%M 的 缩写 形式 。 

注意 : 要 成 功 地 扫描 日 期 ，strptime 需 要 一 个 准确 的 格式 字符 串 ， 
这 一 点 非常 重要 。 一 般 来 说 ， 该 函数 不 会 准确 扫描 读 上 和 目 用 户 的 日 期 ， 
除非 用 户 输入 的 格式 非常 严格 。 

编译 strftime.c 时 ， 你 可 能 会 看 到 编译 器 有 一 个 警告 信息 。 这 是 因 
为 GNU 库 在 默认 情况 下 并 未 声明 strptime 函 数 。 要 解决 这 个 问题 ， 你 需 
要 明确 请 求 使 用 X/Open 的 标准 功能 ， 这 需要 在 包 仿 time.h 头 文件 之 前 

#define XOPEN SOURCE 


Jm En 


4.4 ”临时 文件 


很 多 情况 下 ， 程 序 会 利用 一 些 文件 形式 的 临时 存储 手段 。 这 些 临 
时 文件 可 能 保存 着 一 个 计算 的 中 间 结 果 ， 也 可 能 是 关键 操作 前 的 文件 
备份 。 例 如 ， 一 个 数据 库 应 用 程序 在 删除 记录 时 就 可 能 使 用 临时 文 
件 。 该 文件 收集 需要 保留 的 数据 库 条 目 ， 然 后 在 处 理 结束 后 ， 这 个 临 
时 文件 就 变 成 新 的 数据 库 ， 原 来 文件 则 被 删除 。 

临时 文件 的 这 种 用 法 很 常见 ， 但 也 有 一 个 隐藏 的 缺点 。 你 必须 确 
保 应 用 程序 为 临时 文件 选取 的 文件 名 是 唯一 的 。 否 则 ， 因 为 Linux 是 一 
个 多 任务 系统 ， 男 一 个 程序 就 可 能 选择 同样 的 文件 名 ， 从 而 导致 两 个 
程序 互相 干扰 。 

用 tmpnam 函 数 可 以 生成 一 个 唯一 的 文件 名 : 


#include <stdio.h> 


char *tmpnam(char *s); 


tmpnam EX 2b [8] —41- AP 5; E fnf Cte SC IR] A BPO EE e UE 
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存放 返回 值 的 静态 存储 区 ， 所 以 如 果 tmpnam 要 被 多 次 调用 ， 就 有 必要 
给 它 传 递 一 个 字符 串 参 数 了 。 这 个 字符 串 的 长 度 至 少 要 有 L_tmpnam 
(通常 为 20) 个 字符 。tmpnam 可 以 被 一 个 程序 最 多 调用 TMP_MAX 次 
(至 少 为 几 千 次 ) ， 每 次 它 都 会 返回 一 个 不 同 的 文件 名 。 
如 果 遇 到 需要 立刻 使 用 临时 文件 的 情况 ， 你 可 以 用 tmpfile 函 数 在 
给 它 命 名 的 同时 打开 它 。 这 点 非常 重要 ， 因 为 另 一 个 程序 可 能 会 创建 
出 一 个 与 tnpnam 返 回 的 文件 名 同名 的 文件 。tmpfile 函 数 则 完全 避免 了 
这 个 问题 的 发 生 : 


#include <stdio.h> 


FILE *tmpfile (void); 


tmpfile KAUR [8] — ALMT, EHAE BUS] AE o 
该 文件 以 读 写 方式 打开 (通过 w+ 方式 的 fopen) ， 当 对 它 的 所 有 引用 
全 部 关闭 时 ， 该 文件 会 被 目 动 删除 。 

如 果 出 销 ，tmpfile 返 回 空 指针 并 设置 errno 的 值 。 


X 验 tmpnam 和 tmpfile 
让 我 们 来 看 看 这 两 个 函数 的 用 法 : 


include «stdlib.h 


* 编译 并 运行 程序 tmnpnam.c， 你 可 以 看 到 tmpnam 生 成 的 唯一 文件 


Temporary file name is: /tmp/file2S64zc 


这 个 程序 调用 tmpnam 为 临时 文件 生成 一 个 唯一 的 文件 名 。 如 果 要 
用 它 ， 你 必须 尽 可 能 快 地 打开 它 以 减 小 另 一 个 程序 用 同样 的 名 字 打 开 
文件 的 风险 。tmpfile 调 用 同时 创建 和 打开 一 个 临时 文件 ， 这 样 惑 避免 
了 这 一 风险 。 事 实 上 ， 当 编译 一 个 使 用 tmpnam 函 数 的 程序 时 ，GNU C 
编译 器 会 对 它 的 使 用 给 出 警告 信息 。 

UNIX 有 男 一 种 生成 临时 文件 名 的 方式 ， 束 是 使 用 mktemp 和 
mkstemp 函 数 。Linux 也 文 持 这 两 个 函数 ， 它 们 与 tnpnam 类 似 ， 不 同 之 
处 在 于 可 以 为 临时 文件 名 指定 一 个 模板 ， 模 板 可 以 让 你 对 文件 的 存放 
位 置 和 名 字 有 更 多 的 控制 : 


#include <stdlib.h> 


char *mktemp(char *template); 
int mkstemp(char *template); 


mktemp 函数 以 给 定 的 模板 为 基础 创建 一 个 唯一 的 文件 名 。 
template 参 数 必须 是 一 个 以 6 个 X 字 符 结尾 的 字符 串 。mktemp 函 数 用 有 
效 文 件 名 字符 的 一 个 唯一 组 合 来 蔡 换 这 些 X 字 符 。 它 返回 一 个 指向 生 


rae MARA Ge EM SEN, EIR] T T 28 
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mkstemp EX 2028 (bk Ftmpfile, Eth ze [RISE 81 SF FT FA — 1 li | xc 
件 。 文 件 名 的 生成 方法 和 mktemp 一 样 ， 但 是 它 的 返回 值 是 一 个 打开 
的 、 帮 层 的 文件 描述 符 。 


你 应 该 在 程序 中 使 用 “创建 并 打开 ”函数 tmpfile 和 mkstemp， 而 
不 要 使 用 tmpnam 和 mktemp ° 


4.5 E 


除了 著名 的 init 程 序 以 外 ， 所 有 的 Linux 程 序 都 是 由 其 他 程序 或 用 
户 启动 的 。 你 将 在 第 11 划 中 对 运行 中 的 程序 或 进程 的 交互 进行 更 深入 
的 学 习 。 用 户 通 常 是 在 一 个 啊 应 他 们 命令 的 shell 中 启动 程序 。 你 已 经 
看 人 到， 程序 能 够 通过 检查 环境 变量 和 读 取 系 统 时 钟 来 在 很 大 程度 上 了 
解 它 所 处 的 运行 环境 。 程 序 也 能 够 发 现 它 的 使 用 者 的 相关 信息 。 

当 一 个 用 户 要 登录 进 Linux 系 统 时 ， 他 有 一 个 用 户 名 和 密码 。 一 量 
用 户 名 和 密码 通过 验证 ， 用 户 束 可 以 进入 一 个 shell。 从 内 部 机 制 来 
说 ， 用 户 还 有 一 个 唯一 的 用 户 标识 特 UID。Linux 运 行 的 每 个 程序 实际 
上 都 是 以 某 个 用 户 的 名 义 在 运行 ， 因 此 都 有 一 个 关联 的 UID 。 

你 可 以 对 程序 进行 设置 ， 让 它们 的 运行 看 上 去 好 像 是 由 另 一 个 用 
户 局 动 的 。 当 一 个 程序 的 SUID 位 被 置 位 时 ， 它 的 运行 加 好 像 是 由 该 可 
执行 文件 的 属 主 启动 的 。 当 su 命令 被 执行 时 ， 程 序 的 运行 就 好 像 它 是 
由 超级 用 户 启动 的 ， 它 随后 验证 用 户 的 访问 权限 ， 将 UID 改 为 目标 账 
户 的 UID 值 并 执行 该 账户 的 登录 shell。 采 用 这 种 方式 还 可 以 允许 一 个 
程序 的 运行 束 好 像 是 由 男 一 个 用 户 启动 的 ， 它 经 常 被 系统 管理 员 用 来 
执行 一 些 维护 任务 。 

既然 UID 是 用 户 丑 份 的 关键 ， 我 们 就 从 它 开 始 吧 。 

UID 有 它 自 己 的 类 型 uid_t， 它 定义 在 头 文件 sys/types.h 中 。 它 
通常 是 一 个 小 整数 。 有 些 UID 是 系统 预定 义 的 ， 其 他 的 则 是 系统 管理 
员 在 添加 新 用 户 时 创建 的 。 一 般 情 况 下 ， 用 户 的 UID 值 都 大 于 100。 


#include <sys/types.h> 
#include <unistd.h> 


uid t getuid(void); 
char *getlogin(void); 


setuid EX Zi jx EE IE RE HJUID ， 它 通常 是 启动 程序 的 用 户 的 
UID ? 

getlogin EX 2X [u] Ej 24 gif Fl P^ EKER © 

系统 文件 /etc/passwd 包 含 一 个 用 户 账号 数据 库 。 它 由 行 组 成 ， 
行 对 应 一 个 用 户 ， 包 括 用 户 名 、 加 窗口 令 、 用 户 标识 符 (UID) 、 组 
标识 符 (GID) 、 全 名 、 家 目录 和 默认 shell。 下 面 是 一 个 示例 行 : 


a 


zBqx ifpk 0:Neil thew: /home/nei zh 


”如 果 编写 一 个 程序 亡 能 确定 启动 它 的 用 户 的 UID， 那么 你 就 可 
以 对 它 进 行 扩展 ， 让 它 育 找 密码 文件 以 找到 用 户 的 登录 名 和 全 名 。 但 
我 们 并 不 推荐 这 种 做 法 ， 因 为 为 了 提高 系统 的 安全 性 ， 现 代 的 类 UNIX 
系统 都 不 再 使 用 简单 的 密码 文件 了 。 许多 系统 ， 包括 Linux， 都 有 一 个 
使 用 shadow 密 码 文 件 的 选项 ， 原 来 的 密码 文件 中 不 再 包含 任何 有 用 的 
加 密 口令 信息 (这 些 信息 通 常 存放 在 /etc/shadow 文 件 中 ， 
这 是 一 个 普通 用 户 不 能 读 取 的 文件 ) 。 为 此 ， 人 们 定义 了 一 组 函数 来 
提供 一 个 标准 而 义 有 效 的 获取 用 户 信息 的 编程 接口 : 
#include <sys/types.h> 
#include <pwd.h> 


struct passwd *getpwuid(uid t uid); 
struct passwd *getpwnam(const char *name); 


m ur paz HE E passwd © X. TE3L X. fEpwd.hP, EEE 4-4 FAY 


0 


,有 些 UNIX 系 统 能 对 用 户 全 名 TER TEES. - TERE 
系统 (如 Linux) 上 ， 它 是 pw_gecos， 而 在 其 他 系统 上 ， 它 是 
pw_comment。 这 就 意味 着 ， 我 们 不 能 对 它 给 出 一 个 统一 的 用 法 。 

getpwuid fll getpwnam EK 21 Hh 1k [E] Tli 针 ， 该 指针 指 同 与 ud 
户 对 应 的 passwd 结 构 。 这 个 用 户 通 过 getpwuid 的 UID 参 数 或 通过 
getpwnam 的 用 户 登 录 名 参数 来 确定 。 出 错时 ， 它 们 都 返回 一 个 空 指针 
并 设置 errno。 


x 验 用 户 信息 
下 面 的 程序 user.c 从 密码 数据 库 中 提取 出 一 些 用 户 信息 


ex 


它 给 出 如 下 的 输出 ， 在 不 同 的 Linux 和 UNIX 版 本 中 ， 和 输出 结果 可 
BE ZB A Ze: 


S ./user 
User is nei 


实验 解析 

这 个 程序 先 调 用 getuid 获 得 当前 用 户 的 UID， 再 把 这 个 UID 用 在 
getpwuid 函 数 中 来 获得 密码 文件 中 保存 的 详细 信息 。 此 外 ， 我 们 还 演 
示 了 通过 在 getpwnam 中 给 出 用 户 名 root 来 获得 用 户 信息 的 方法 。 


如 有 果 查 看 Linux 的 产 代 码 ， 你 就 能 在 id 命 令 的 源 代 码 中 看 到 男 
一 个 使 用 getuid 函 数 的 例子 。 


如 果 要 扫描 密码 文件 中 的 所 有 信息 ， 你 可 以 使 用 getpwent 函 数 。 
它 的 作用 是 依次 取出 文件 数据 项 : 


#include <pwd.h> 
#include <sys/types.h> 


void endpwent (void); 
struct passwd *getpwent (void); 
void setpwent (void); 
getpwent 函 数 依 次 返回 每 个 用 户 的 信息 数据 项 。 当 到 达 文 件 尾 
时 ， 它 返回 一 个 空 指针 。 如 有 果 已 经 扫描 了 足够 多 的 数据 项 ， 你 可 以 使 
用 endpwent 函 数 来 终止 处 理 过 程 。setpwent 函 数 重 置 读 指 针 到 密码 文件 
的 开始 位 置 ， 这 样 下 一 个 getpwent 调 用 将 重新 开始 一 个 新 的 扫描 。 这 
些 函 数 的 操作 方式 与 我 们 在 第 3 草 讨 论 的 日 录 扫 摘 范 数 opendir ` readdir 
和 closedir 非 常 相似 。 
(有 效 的 和 实际 的 ) 用 户 和 组 标识 符 还 可 以 被 其 他 一 些 不 太 常 用 
的 函数 获得 : 
#include <sys/types.h> 
#include <unistd.h> 


uid_t geteuid(void); 


gid_t getgid(void); 

gid t getegid(void); 

int setuid(uid t uid); 

int setgid(gid t gid); 

组 标识 符 和 有 效用 户 标识 符 的 详细 资料 请 参考 系统 的 手册 页 ， 虽 
然 你 可 能 会 发 现 和 目 己 根本 不 需要 对 它们 进行 处 理 。 


AA BRA P T Beli A setuid#lsetgid kN 2X » 


4.6_ 主 机 信息 


正如 程序 可 以 查找 用 户 信 息 一 样 ， 程 序 也 可 以 获得 运行 它 的 计算 
机 的 有 关 细 节 。uname 命 令 束 提供 这 类 信息 。 我 们 还 可 以 通过 同名 的 
系统 调用 在 C 语 言 程 序 中 提供 同样 的 信息 请 使 用 man 2 uname 命 令 
在 手册 页 的 系统 调用 部 分 〈 第 2 部 分 ) 查找 它 的 用 法 。 

主机 信息 在 许多 情况 下 都 是 很 有 用 的 。 你 可 能 和 希望 根据 程序 运行 
的 机 器 在 网 络 上 的 名 字 来 定制 程序 的 行为 ， 比 如 说 ， 这 台 机 器 是 学 生 
用 的 还 是 管理 员 用 的 。 从 许可 证 的 角度 考虑 ， 你 可 能 希望 限制 程序 只 
能 在 一 台 机 絮 上 运行 。 所 有 这 些 都 意味 着 你 需要 一 个 方法 来 确定 程序 
运行 在 哪 台 机 器 上 。 

如 果 系 统 安 装 了 网 络 组 件 ， 你 可 以 通过 gethostname 另 数 很 容易 地 
获取 它 的 网 络 名 : 


#include <unistd.h> 


int gethostname(char *name, size t namelen); 
gethostname EX TEL as AY 9] 28 45 Ej A name^£ 4 FR. o SE TERR 4b 

有 namelen 个 字符 长 。 成 功 时 ，gethostbyname 返 回 0， 否 则 返回 -1。 
你 可 以 通过 uname 系 统 调用 获得 天 于 主机 的 更 多 详细 信息 : 


#include <sys/utsname.h> 


int uname (struct utsname *name) ; 


uname RAE = dL ES A name 245 [Fl 25 4 © utsnameZi& 4) XE 
义 在 头 文件 sys/utsname.h 中 ， 它 至 少 包 含 表 4-5 所 示 的 成 员 。 


表 4-5 


uname 在 成 功 时 返回 一 个 非 负 整数 ， 否 则 返回 -1 并 设置 ermo 
来 指出 错误 。 


Sc 验 主机 信息 
Bsns eee 能 够 提取 出 一 些 主机 信息 


machine 


它 给 出 如 下 所 示 的 Linux 特 有 的 和 输出。 如 采 你 的 机 器 联网 了 ， 你 可 
会 看 到 一 个 包含 网 络 名 在 内 的 扩展 主机 名 。 


, /hostget 


实验 解析 

这 个 程序 调用 gethostname 来 获得 主机 的 网 络 名 。 在 上 面 的 例子 
中 ， 它 获得 名 字 susel03。 有 关 这 人 台 基 于 Intel Pentium-4 的 Linux 计 算 机 
的 更 多 信息 通过 uname 调 用 返回 。 注 意 ，uname 返 回 的 字符 串 的 格式 是 
与 具体 实现 相关 的 ， 在 本 例 中 ， 版 本 字符 串 包含 内 核 编 译 的 日 期 。 


"T z QUA 贺 数 的 另外 一 个 例子 请 参看 uname 命 令 的 Linux 源 


每 台 主 机 的 唯一 标识 符 可 以 通过 gethostid 函 数 获得 : 


#include <unistd.h> 


long gethostid(void) ; 


gethostid EX BOK E 5; E HLS DLA — AEE o TF BY Ue BL HH 
它 来 确保 软件 程序 只 能 在 拥有 合法 许可 证 的 机 右上 运行 。 在 Sun 工 作 
站 上 ， 该 男 数 返回 计算 机 生产 时 设置 在 非 易 失 性 存储 器 中 的 一 个 数 
字 ， 它 对 系统 硬件 来 说 是 唯一 的 。 其 他 系统 ， 如 Linux， 返 回 一 个 基于 
该 机 器 因特网 地 址 的 值 ， 但 这 对 许可 证 管理 来 说 还 不 够 安全 。 
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许多 应 用 程序 需要 记录 它们 的 活动 。 系 统 程序 经 常 需要 癌 控 制 台 
或 日 志文 件 写 消息 。 这 些 消息 可 能 指示 错误 、 和 警告 或 是 与 系统 状态 有 
天 的 一 般 信息 。 例 如 ，su 程 序 会 把 某 个 用 户 尝 试 得 到 超级 用 户 权 限 但 
失败 的 事实 记录 下 来 。 

通常 这 些 日 志 信 息 被 记录 在 系统 文件 中 ， 而 这 些 系统 文件 又 被 保 
存在 专用 于 此 目的 的 目录 中 。 它 可 能 是 /usr/adm 或 /Var/log 目 录 。 对 一 
个 典型 的 Linux 安 装 来 说 ， 文 件 /vavlog/messages 包 含 所 有 系统 信 
A, /var/log/mail E S R A AME A AHA H ia, /var/log/debug FJ 
能 包含 调试 信息 。 根 据 你 所 使 用 Linux 版 本 的 不 同 ， 可 以 通过 得 
看 /etc/syslog.conf 文 件 或 者 /etc/syslog-ng/sys-log-ng.conf 文 件 来 检查 系统 
配置 。 


下 面 是 一 些 日 志 信 息 的 示例 : 


Va ^ 
Kay 4 


这 里 ， 你 可 以 看 到 记录 的 各 种 类 型 的 信息 。 前 几 个 是 由 Linux 内 核 
在 启动 和 检测 已 安装 硬件 时 自己 报告 的 信息 。 然 后 是 防火 墙 记 录 它 重 
新 配置 的 信息 。 最 后 ，su 程 序 报告 用 户 neil 获 得 了 超级 用 户 权限 。 


查看 日 志 信 息 可 能 需要 有 超级 用 户 特 权 。 
有 些 UNIX 系 统 并 不 像 上 面 这 样 提供 可 读 的 日 志文 件 ， 而 是 为 管理 
m oc ee eee depu CUI 。 具 体 情 况 请 参考 系统 文 


虽然 系统 消息 的 格式 和 存储 方式 不 尽 相 同 ， 但 产生 消息 的 方法 却 
E o UNIX $L CHW syslog HAN PIS ERE T^ E Hs bet r 
^| ES []: 


#include «syslog.h» 


void syslog(int priority, const char *message, arguments...); 


syslog 函 数 向 系统 的 日 志 设 施 (facility) 发 送 一 条 日 志 信 息 。 每 条 
言 轧 都 有 一 个 priority 参 数 ， 该 参数 是 一 个 严重 级 别 与 一 个 设施 值 的 按 
"严重 级 别 控制 日 志 信 息 的 处 理 方式 ， 设 施 值 记 录 日 志 信息 的 来 
源 。 

定义 在 头 文件 syslog.h 中 的 设施 值 包括 LOG_USER (默认 值 ) 一 一 
它 指 出 消息 来 目 一 个 用 户 应 用 程序 ， 以 及 LOG_LOCAL0 ` 
LOG_LOCAL1 直 到 LOG_LOCAL7， 它 们 的 含义 由 本 地 管理 员 指 定 。 

严重 级 别 按 优先 级 递减 排列 ， 如 表 4-6 所 示 。 


表 4-6 


kA 


根据 系统 配置 ，LOG_EMERG 信 息 可 能 会 广播 给 所 有 用 户 ， 
LOG_ALERT 信 息 可 能 会 EMAIL 给 管理 员 ，LOG_DEBUG 信 息 可 能 会 
被 忽略 ， 而 其 他 信息 则 写 入 日 志文 件 。 当 编写 的 程序 需要 使 用 日 志 记 
录 功 能 时 ， 你 只 需要 在 希望 创建 日 志 信 息 时 调用 syslog 范 数 即 可 。 

syslog 创 建 的 日 志 信 息 包 含 消 息 头 和 消息 体 。 消 息 头 根据 设施 值 
及 日 期 和 时 间 创 建 。 消 息 体 根据 syslog 的 message 参 数 创建 ， 该 参数 的 
作用 类 似 printf 中 的 格式 字符 串 。syslog 的 其 他 参数 要 根据 message 字 符 
串 中 printf 风 格 的 转换 控制 符 而 定 。 此 外 ， 转 换 控 制 符 %m 可 用 于 插入 
ee 前 值 对 应 的 出 错 消息 字符 串 。 这 对 于 记录 错误 消息 
1 o 


x 验 syslog Hat 
在 这 个 程序 中 ， 你 试图 打开 一 个 不 存在 的 文件 : 


Pinciuce pt 25.F 


编译 并 运行 这 个 程序 syslog.c ， 你 没有 看 到 输出 ， 但 
是 /Var/log/messages 文 件 尾 现在 有 如 下 一 行 : 


Jun 


实验 解析 

在 这 个 程序 中 ， 你 试图 打开 一 个 不 存在 的 文件 。 在 文件 打开 失败 
后 ， 调 用 syslog 在 系统 日 志 中 记录 这 一 事件 。 

注意 : 日 志 信 息 并 未 指明 是 哪个 程序 调用 了 日 志 设 施 ， 它 仅仅 记 
孙 syslog 被 调用 以 记录 一 条 信息 的 事实 。26m 转 换 控制 符 被 奉 换 为 一 个 
错误 拉 述 ， 在 本 例 中 束 是 “文件 没有 找到 ”。 这 比 仅仅 报告 一 个 原始 的 
背 误 码 更 有 用 ° 
E MEE EI 日 志 记 录 行 为 的 其 他 邢 
UX “ 它 | 是 : 


#include <syslog.h> 


void closelog(void); 
void openlog(const char *ident, int logopt, int facility); 
int setlogmask(int maskpri); 


UR RJ DAH val FH openlog HAVEL A zs fei FEAR TK EL RI DÀ 
设置 一 个 字符 串 ident， 该 字符 串 会 添加 在 日 志 信 息 的 前 面 。 你 可 以 通 
过 它 来 指明 是 哪个 程序 创建 了 这 条 信息 。facility 参 数 记 录 一 个 将 被 用 
于 后 续 syslog 调 用 的 默认 设施 值 ， 其 默认 值 是 LOG_USER。1logopt 参 数 
对 后 续 syslog 调 用 的 行为 进行 配置 ， 它 是 0 个 或 多 个 表 4-7 中 参数 的 按 位 
HV o 


= 


logopt 5m 


(E * gg" a2 vat 4 in * 
WRIRRTRAWRAY LT af Rieti i 


"m ES b Rb. 


openlog N35: 4) BGJFTT2T— POC Ra, JPXEDX ERS B S o 
UR RJ LA Val H closelog KAEKA E 9 HER, TEVA A syslog? Bi Z6 s Va FH 
openlog， 因 为 syslog 会 根据 需要 目 行 打开 日 志 设 施 。 

你 可 以 使 用 setlogmask 函 数 来 设置 一 个 日 志 掩 码 ， 并 通过 它 来 控制 
日 志 信 息 的 优先 级 。 优 先 级 未 在 日 志 撼 码 中 置 位 的 后 续 syslog 调 用 都 
将 被 丢弃 。 所 以 你 可 以 通过 这 个 方法 关闭 LOG_DEBUG 消 息 而 不 用 改 
变 程序 主体 。 


你 可 以 用 LOG_MASK (priority) 为 日 志 信 息 创建 一 个 掩 码 ， 它 的 
作用 是 创建 一 个 只 包含 一 个 优先 级 的 掩 码 。 你 还 可 以 用 LOG_UPTO 
(priority) 来 创建 一 个 由 指定 优先 级 之 上 的 所 有 优先 级 (包括 指定 优 
先 级 ) 构成 的 掩 码 。 


sx 验 logmask 程 序 
在 本 例 中 ， 你 将 看 到 日 志 掩 码 的 作用 : 


这 个 logmask.c 程 序 没有 输出 ， 但 是 在 一 个 典型 的 Linux 系 统 中 ， 
在 /vavlog/messages 文 件 尾 ， 你 会 看 到 如 下 信息 : 


接收 调试 日 志 信 息 的 文件 〈 根 据 日 志 配 置 而 定 ， 通 常 
是 /var/log/debug， 有 时 也 可 能 是 /var/log/messages) 会 包含 如 下 信息 : 


实验 解析 

这 个 程序 用 它 目 己 的 名 字 logmask 初 始 化 日 志 设 施 ， 并 要 求 日 志 信 
居中 包含 进程 标识 符 。 一 般 信息 记录 到 文件 /var/log/messages 中 ， 调 试 
信息 记录 到 文件 /var/log/debug 中 。 第 二 条 调试 信息 没有 出 现 ， 这 是 
为 你 调用 setlogmask 名 略 了 优先 级 低 于 LOG_NOTICE 的 所 有 信息 GE 
意 ， 这 种 做 法 在 早期 Linux 内 核 中 可 能 不 支持 ) 。 

如 果 你 的 Linux 安 装 没 有 局 用 调试 信息 日 志 记 录 功 能 ， 或 者 采用 的 
是 其 他 配置 情况 ， 你 可 能 看 不 到 调试 信息 。 要 启用 所 有 的 调试 信息 ， 
请 查看 系统 中 针对 syslog 或 syslog-ng 的 文档 以 找到 正确 的 配置 方法 。 

logmask.c 还 用 到 了 getpid 函 数 ， 它 和 与 其 紧密 相关 的 getppid 函 数 
的 定义 如 下 所 示 : 


#include <sys/types.h> 
#include <unistd.h> 


pid_t getpid(void); 
pid t getppid(void); 

这 两 个 函数 分 别 返回 调用 进程 和 调用 进程 的 父 进程 的 进程 标识 符 
(PID) 。 要 了 解 PID 的 更 多 内 容 ， 请 参考 第 11 章 的 内 容 。 


4.8 ih 


Linux 系 统 上 运行 的 程序 会 受到 资源 限制 的 影响 。 它 们 可 能 是 硬件 
方面 的 物理 性 限制 《例如 内 存 ) 、 系 统 策略 的 限制 〈《 例 如， 人 允许 使 用 
的 CPU 时 间 ) 或 具体 实现 的 限制 《如 整数 的 长 度 或 文件 名 中 所 人 允许 的 
最 大 字符 数 ) 。UNIX 规 范 定 义 了 一 些 可 由 应 用 程序 决定 的 限制 。 第 7 
章 对 限制 及 突破 限制 的 后 果 做 了 进一步 讨论 。 

头 文件 limits.h 中 定义 了 许多 代表 操作 系统 方面 限制 的 显 式 常量 ， 
如 表 4-8 所 示 。 


mumu * x 


"Le 的 限制 ， 请 参考 你 目 己 系 统 中 的 头 


TER: NAME_MAX 有 是 特定 于 文件 系统 的 。 为 了 写 可 移植 性 
es 你 应 该 使 用 pathconf 函 数 。 详 细 信息 请 参考 pathconf 
Ui o 


头 文 件 sys/resource.h 提 供 了 资源 操作 方面 的 定义 ， 其 中 包括 对 程 
序 长 度 、 执 行 优先 级 和 资源 等 方面 限制 进行 查询 和 设置 的 函数 : 


#include <sys/resource.h> 


int getpriority(int which, id_t who); 

int setpriority(int which, id t who, int priority); 

int getrlimit(int resource, struct rlimit *r limit); 

int setrlimit(int resource, const struct rlimit *r limit); 
int getrusage(int who, struct rusage *r usage); 


id tz& — T EZ 2S 7M, "E HIT FH P MAMRE 9 TELE 
sys/resource.h 中 定义 的 rusage 结 构 用 来 确定 当前 程序 已 耗费 了 多 少 CPU 
时 间 ， 它 至 少 包 含 表 4-9 所 示 的 两 个 成 员 。 


表 4-9 


timeval 结构 定义 在 头 文 件 systime.h 中 ， 它 包含 成 员 tv_sec 和 
tv_usec， 分 别 代 表 秒 和 微 秒 。 

一 个 程序 耗费 的 CPU 时 间 可 分 为 用 户 时 间 (程序 执行 自身 的 指令 
所 耗费 的 时 间 ) 和 系统 时 间 (操作 系统 为 程序 执行 所 耗费 的 时 间 ， 即 
执行 输入 输出 操作 的 系统 调用 或 其 他 系统 函数 所 花费 的 时 间 ) 。 

getrusage 画 数 将 CPU 时 间 信 息 写 入 参数 r_usage 指 问 的 rusage 结 构 
中 。 参 数 who 可 以 是 表 4-10 所 示 的 常量 之 一 。 


表 4-10 


who tt @ 


我 们 将 在 第 11 章 讨论 子 进程 和 任务 优先 级 ， 但 考虑 到 完整 性 ， 我 
们 将 在 这 里 简单 介绍 它们 对 系统 资源 的 影响 。 束 现在 而 言 ， 了 解 下 面 
一 点 束 够 了 :每 个 运行 的 程序 都 有 一 个 与 之 关联 的 优先 级 ， 优 先 级 越 
高 的 程序 将 分 配 到 更 多 的 CPU 可 用 时 间 。 


普通 用 户 只 能 降低 其 程序 的 优先 级 ， 而 不 能 升 高 。 


应 用 程序 可 以 用 getpriority 和 setpriority 函 数 确 定 和 更 改 它 们 (和 其 
他 程序 ) 的 优先 级 。 被 优先 级 函数 检查 或 更 改 的 进程 可 以 用 进程 标识 
a 户 来 确定 。which 参 数 指定 了 对 符 who 参 数 的 方式 ， 
H#24-11 TAR ° 
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setpriority 函 数 用 于 设置 一 个 新 的 优先 级 〈 如 果 可 能 的 话 ) 。 
默认 的 优先 级 是 0。 正 数 优先 级 用 于 后 台 任 务 ， 它 们 只 在 没有 其 他 
更 高 优先 级 的 任务 准备 运行 时 才 执行 。 负 数 优先 级 使 一 个 程序 运行 更 


频繁 ， 获 得 更 多 的 CPU 可 用 时 间 。 优 先 级 的 有 效 范围 是 -20~+20。 这 很 
容易 让 人 困惑 ， 因 为 数值 越 高 ， 执 行 优先 级 反而 越 低 。 

getpriority 在 成 功 时 返回 一 个 有 效 的 优先 级 ， 失 败 时 返回 -1 并 设置 
errno 变 量 。 因 为 -1 本 喘 是 一 个 有 效 的 优先 级 ， 所 以 在 调用 getpriority 之 
前 应 将 ermo 设 置 为 0， 并 在 函数 返回 时 检查 它 是 否 仍 为 0。setpriority 在 
成 功 返 回 0， 否 则 返回 -1。 

系统 资源 方面 的 限制 可 以 通过 getrlimit 和 setrlimit 来 读 取 和 设置 。 
这 两 个 函数 都 利用 一 个 通用 结构 rlimit 来 描述 资源 限制 。 该 结构 定义 在 
头 文件 sys/resource.h 中 ， 它 包含 表 4-12 所 示 的 成 员 。 


表 4-12 
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类 型 Him_t 是 一 个 整数 类 型 ， 它 用 来 描述 资源 级 别 。 一 般 来 说 ， 软 
限制 是 一 个 建议 性 的 最 好 不 要 超越 的 限制 ， 如 果 超 越 可 能 会 导致 库 函 
数 返 回 错误 。 硬 限制 如 果 被 超越 ， 则 可 能 会 导致 系 统 通过 发 送信 号 的 
方式 来 终止 程序 的 运行 。 例 如 ， 当 CPU 时 间 限 制 被 超越 时 系统 会 发 送 
SIGXCPU 信 号 ， 数 据 长 度 限 制 被 超越 时 系统 会 发 送 SIGSEGV 信 号 。 程 
序 可 以 把 自己 的 软 限制 设置 为 小 于 便 限 制 的 任何 值 。 它 也 可 以 减 小 自 
己 的 硬 限制 。 但 只 有 以 超级 用 户 权限 运行 的 程序 才能 增加 硬 限制 。 

有 许多 系统 资源 可 以 进行 限制 ， 它 们 由 rlimit 函 数 中 的 resource 参 
数 指定 ， 并 在 头 文件 sys/resource.h 中 定义 ， 如 表 4-13 所 示 。 
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下 面 的 实验 给 出 了 一 个 程序 limits.c， 它 模拟 一 个 典型 的 应 用 程 
序 。 该 程序 设置 并 超越 了 一 个 资源 限制 。 


实 验 资源 限制 


(1) 首先 ， 把 你 在 程序 中 要 用 到 的 所 有 函数 对 应 的 头 文件 包含 进 


和 
-| 


(2) void work () 函数 将 一 个 字符 串 写 入 一 个 临时 文件 10 000 
次 ， 然 后 做 一 些 算术 运算 以 产生 CPU 负 载 : 


void work 


(3) _ main 函数 调用 work 函 数 ， 然 后 用 getrusage 范 数 来 发 现 它 耗 
费 的 CPU 时 间 ， 并 把 该 信息 显示 在 屏幕 上 : 


80614\n"* 


tu 


(4 ) 接着 main E 20) 别 调 用 setoriority fi getrlimit 来 发 现 它 的 当 
前 优先 级 和 文件 大 小 限制 : 


Jetpriority(PRIO PROCESS, getpidi)!: 
ren* ri tu aad 


imit.rlis it 


(5) 最后， 我 们 用 setrlimit 设 置 文件 大 小 限制 并 再 次 调用 work， 
这 次 work 函 数 的 执行 会 失败 ， 因 为 它 试图 创建 一 个 太 大 的 文件 : 


br limit 


当 运 行 这 个 程序 时 ， 你 可 以 看 到 消耗 的 CPU 资 源 有 多 少 以 及 程序 
运行 的 默认 优先 级 。 一 旦 设置 了 文件 大 小 限制 ， 程 序 就 不 能 往 临 时 文 
件 里 写 入 多 于 2 048 个 字 节 了 。 


> cc -o limits limits.c -lm 


LAUUUN com = 


nores 1 - 4 ` 4 
y art TC = , "s J - = Doy os 
i env ro2l4! L - SOLL = 4 hard = = 


Se ng a 2K file size limit 


File ze limit exceeded 


你 可 以 用 nice 命 令 局 动 程序 来 改变 程序 的 优先 级 。 这 里 ， 你 看 到 
程序 的 优先 级 变 成 了 +10。 因 此 ， 程 序 的 执行 时 间 变 长 了 。 


> nice ./limits 


实验 解析 

limits 程 序 通过 调用 work 函 数 来 模拟 一 个 典型 程序 的 行为 。 它 执行 
一 些 运 算 并 产生 一 些 输出 ， 在 本 例 中 ， 它 输出 大 约 150K 字 节 的 数据 到 
临时 文件 。 它 调用 资源 函数 来 发 现 其 优先 级 和 文件 大 小 限制 。 在 本 例 
中 ， 文 件 大 小 限制 未 设置 ， 所 以 你 想 创建 多 大 的 文件 整 可 以 创建 多 大 
的 文件 (只 要 磁盘 空间 允许 ) 。 随 后 ， 程 序 设置 它 的 文件 大 小 限制 为 
2K 并 再 次 执行 一 些 工 作 。 此 时 ，work 函 数 的 调用 失败 了 ， 因 为 它 不 能 
创建 太 大 的 临时 文件 。 


你 也 可 以 通过 bash 的 ulimit 命 令 为 在 某 一 特定 shell 中 运行 的 程 
序 设置 限制 。 


在 本 例 中 ， 出 错 信 息 Error writing to temporary file ( 写 临 时 文件 出 
fH) 可 能 不 会 像 你 期 望 的 那样 打印 出 来 。 这 是 因为 当 资源 限制 被 超越 


时 ， 一 些 系统 (如 Linux 2.2 和 后 续 版 本 ) 会 通过 发 送信 号 SIGXFSZ 的 
方式 来 终止 程序 。 你 将 在 第 11 章 学 习 有 关 信 号 及 其 使 用 的 更 多 知识 。 
其 他 一 些 POSIX 兼 容 的 系统 可 能 只 是 让 资源 限制 被 超越 的 函数 返回 一 
错误。 
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ERREP, MITAT LinuxbABE, HAET ATIRE ET D Ut 
完 。 你 学 习 了 命令 行 参数 和 环境 变量 ， 它 们 都 能 用 来 改变 程序 的 默认 
行为 ， 并 提供 有 用 的 程序 选项 。 

你 还 看 到 程序 怎样 利用 库 函 数 来 处 理 日 期 和 时 间 值 ， 获 得 目 身 、 
用 户 及 它 运 行 之 上 的 计算 机 的 相关 信息 。 

因为 Linux 程 序 通 疝 都 要 共 至 主机 上 的 宝贵 资源 ， 所 以 本 章 也 对 如 
何 确定 和 管理 资源 的 问题 做 了 介绍 。 


5EL 2X ) 


-— 


在 未 章 中 你 将 看 到 如 何 完 善 第 2 章 中 的 基本 应 用 程序 。 该 程序 
最 明显 的 不 足 就 是 其 用 户 界 面 ， 虽 然 它 实现 了 所 需 功 能 ， 但 并 不 好 
用 。 在 本 章 中 ， 你 将 学 习 如 何 更 好 的 控制 用 户 终端 ， 包 括 控制 键盘 输 
入 及 屏幕 输出 。 不 仅 如 此 ， 你 还 将 学 习 如 何 保证 编写 的 程序 能 够 从 用 
户 那 里 获取 输入 〈 即 使 用 户 对 程序 使 用 了 输入 重 定向 ) ， 以 及 确保 程 
序 的 输出 显示 在 屏幕 的 正确 位 置 上 。 

虽然 ， 重 新 实现 CD 数据 库 应 用 程序 的 构想 只 有 到 第 7 章 的 结束 才 
能 见 到 上 明光， 但 你 将 在 本 章 为 第 7 章 做 大 量 的 底层 准备 工作 。 第 6 章 是 
iF curses), (HEAR BAGEL, mE ANKRE, CRE 
了 控制 终端 屏幕 显示 的 高 级 代码 。 同 时 ， 我 们 还 将 通过 介绍 一 些 Linux 
和 UNIX 的 哲学 思想 以 及 终端 输入 和 输出 的 概念 来 前 明 早 期 UNIX 社 
成 员 的 想法 。 也 许 ， 我 们 在 这 里 给 出 的 底层 访问 方式 正 是 您 正在 寻找 
的 。 我 们 将 在 这 里 介绍 的 绝 大 部 分 内 容 同样 适用 于 运行 在 终端 窗口 中 
的 程序 ， 如 运行 在 KDE 的 Kconsole、GNOME 的 gnome-terminal 或 者 是 
标准 X11 的 xterm 中 的 程序 。 

在 本 章 中 ， 你 将 学 习 以 下 内 容 : 
对 终端 进行 读 写 
终端 驱动 程序 和 通用 终端 接口 
termios 
终端 的 输出 和 terminfo 
分 测 键盘 击 键 动作 
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在 第 3 章 中 ， 你 了 解 到 当 一 个 程序 在 命令 提示 符 中 被 调用 时 ，shell 
负责 将 标准 输入 和 标准 输出 流连 接 到 你 的 程序 。 通 过 在 程序 中 使 用 
getchar 和 printf 函 数 ， 你 可 以 很 容易 地 对 这 些 默认 流 进 行 读 写 ， 实 现 程 
序 和 用 户 之 间 的 交互 。 

在 下 面 的 实验 中 ， 你 将 使 用 上 面 提 到 的 两 个 芳 数 getchar 和 printf 重 
写 羔 单 例 程 ， 新 程序 的 文件 名 为 menul.c。 


实 验 用 C 语 言 编 写 的 菜单 例 程 
(1) 程序 开始 部 分 的 语句 定义 了 一 个 用 来 显示 菜单 内 容 的 字符 数 
组 和 getchoice 函 数 的 原型 : 


(2) main 函数 以 刚才 定义 的 样本 菜单 字符 数组 menu 为 参数 调用 
getchoiceER ZA: 


(3) 下 面 是 这 个 程序 的 核心 代码 : 负责 显示 菜单 及 读 取 用 户 输 入 
的 函数 getchoice: 


实验 解析 

getchoice EX Zi TK EFT HJ 4 128 [i I greet LEE choices, 2f 3E 
求 用 户 输入 代表 某 个 菜单 选项 的 站 字符 。 接 下 来 ， 程 序 进入 循环 ， 直 
到 Ee 回 与 option 字 符 数 组 中 某 个 数组 成 员 的 首 字 和 母 匹 配 的 字 
符 为 止 。 

编译 并 运行 这 个 程序 ， 你 会 发 现 它 并 没有 像 你 所 期 望 的 那样 工 
作 。 下 面 的 例子 说 明了 这 一 问题 : 


$ ./menul 

Choice: Please select an action 
a - add new record 

d - delete record 
q 
a 


You have chosen: a 


Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 


Incorrect choice, select again 
Choice: Please select an action 
- add new record 
- delete record 


atin ike 
quit 


Qum 


You have chosen: q 

用 户 必 须要 输入 “A/ 回 车 /Q/ 回 车 ”等 才能 做 出 选择 。 从 上 面 的 例子 
中 可 以 看 出 ， 这 个 程序 至 少 有 两 个 问题 。 最 严重 的 问题 是 ， 每 当 你 做 
出 正确 的 选择 后 ， 屏 幕 上 都 会 出 现 错误 提示 Incorrect choice, select 
again (错误 的 选择 ， 请 重新 选择 ) 。 男 一 个 问题 是 ， 只 有 在 按 下 回 车 
键 后 程序 才 会 读 取 输 入 。 


1. 标准 模式 和 非 标 准 模式 


这 两 个 问题 是 紧密 相关 的 。 默 认 情 况 下 ， 只 有 在 用 户 按 下 回 车 键 
后 ， 程 序 才 能 读 到 终端 的 输入 。 在 大 多 数 情 况 下 ， 这 样 做 是 有 益 的 ， 
因为 它 允 许 用 户 使 用 退 格 键 (Backspace) 或 删除 键 (Delete) 来 纠正 
输入 中 的 错误 ， 用 户 只 在 对 目 己 在 屏幕 上 看 到 的 内 容 满意 时 ， 才 会 按 
下 回 车 键 把 键入 的 数据 传递 给 程序 。 

这 种 处 理 方 式 被 称 为 规范 模式 (canonical mode) 或 标准 模式 
(standard mode) 。 所 有 的 输入 都 基于 行进 行 处 理 ， 在 一 个 输入 行 完 
成 前 (通常 是 用 户 按 下 回 车 键 之 前 ) ， 终 端 接口 负责 管理 所 有 的 键盘 
输入 ， 包 括 退 格 键 ， 应 用 程序 读 不 到 用 户 输 入 的 任何 字符 。 

与 标准 模式 相对 的 是 非 标准 模式 (non-canonical mode) ， 在 这 种 
模式 中 ， 应 用 程序 对 用 户 输入 字符 的 处 理 拥有 更 大 的 控制 权 。 我 们 稍 


后 会 再 回 到 这 两 种 模式 上 来 。 

除 此 之 外 ，Linux 终 端 处 理 程 序 能 够 把 中 断 字 符 转 换 为 对 应 的 信和 号 
〈 例 如 ， 按 下 Ctrl+C 可 以 中 断 程 序 ) 从 而 自动 替 用 户 完成 对 退 格 键 和 
删除 键 的 处 理 ， 用 户 无 需 在 自己 编写 的 每 个 程序 中 重新 实现 它 。 我 们 
将 在 第 11 章 详细 介绍 信号 。 

那么 ， 这 个 程序 的 问题 究竟 在 哪里 呢 ? 是 这 样 的 ，Linux 会 暂 存 用 
户 输入 的 内 容 ， 直 到 用 户 按 下 回 车 键 ， 然 后 将 用 户 选 择 的 字符 及 紧 随 
其 后 的 回 车 符 一 起 传递 给 程序 。 所 以 ， 每 当 你 输入 一 个 菜单 选择 时 ， 
程序 就 调用 getchar 函 数 处 理 该 字符 ， 而 当 程 序 在 下 一 次 循环 中 再 次 调 
用 getchar 函 数 时 ， 它 会 立刻 返回 一 个 回 车 符 o 

程序 真正 看 到 的 字符 并 不 是 ASCII 码 的 回 车 符 CR (十进制 表示 为 
13， 十 六 进 制 表示 为 OD) ， 而 是 换行 符 LE 〈 十 进 制 表示 为 10， 十 六 
进 制 表示 为 OA) 。 这 是 因为 ，Linux 同 UNIX 系 统一 样 ， 在 其 内 部 都 是 
以 换行 符 作 为 文本 行 的 结束 。 也 就 是 说 ，UNIX 用 一 个 单独 的 换行 符 来 
表示 一 行 的 结束 ， 而 其 他 的 操作 系统 (MS-DOS) 用 回 车 符 和 换行 
符 两 个 字符 的 结合 来 表示 一 行 的 结束 。 如 果 输 入 或 输出 设备 本 身 需 要 
发 送 或 接收 一 个 回 车 符 ， 则 由 Linux 终 端 处 理 程序 负责 完成 它 。 如 果 你 
已 经 习惯 MS-DOS 或 其 他 操作 系统 的 环境 ， 你 可 能 会 对 Linux 的 这 种 做 
法 感到 有 一 些 奇怪 。 但 这 样 做 的 最 大 好 处 是 ， 它 使 得 在 Linux 系 统 中 ， 
文本 文件 和 二 进 制 文件 无 任何 实际 的 区 别 。 只 有 在 对 终端 、 某 些 打 印 
机 或 绘图 仪 进行 输入 输出 时 ， 你 才 需 要 对 回 车 符 进 行 处 理 。 
OO ee 
EIR: 


do ( 


selected = getchar(); 
) while(selected =» ‘\n’) 


它 解 决 了 燃眉之急 ， 你 将 看 到 如 下 所 示 的 输出 : 
$ ./menul 

Choice: Please select an action 

a - add new record 

d - delete record 


- quit 


You have chosen: a 

Choice: Please select an action 
a - add new record 

d - delete record 


a - quit 


You have chosen: q 


我 们 将 在 本 章 的 后 面 针对 这 个 程序 的 第 二 个 问题 “必须 按 下 回 千 键 
才能 让 程序 继续 执行 ”， 给 出 一 个 更 加 精巧 的 解决 方案 。 


2. 处 理 重 定向 输出 
Linux 程 序 ， 甚 至 是 交互 式 的 Linux 程 序 ， 经 常会 把 它们 的 输入 或 


输出 重 定 同 到 文件 或 其 他 程序 。 我 们 来 看 看 把 程序 的 输出 重 定 疝 到 一 
个 文件 时 出 现 的 情况 : 


S ./menul > file 
a 


q 
9 


你 可 以 把 这 种 处 理 方式 看 作 是 成 功 的 ， 因 为 程序 的 输出 确实 被 重 
定 同 到 文件 ， 而 不 是 显示 在 终端 上 。 但 有 时 你 并 不 想 这 么 做 ， 或 者 你 
布 望 对 准备 让 用 户 看 到 的 提示 信息 与 其 他 输出 进行 区 别 对 待 ， 前 者 仍 
然 输 出 到 终端 上 ， 而 后 者 可 以 被 安全 地 重 定 问 。 

如 果 想 知道 标准 输出 是 否 被 重 定 同 了 ， 只 需 检查 底层 文件 描述 符 
是 否 天 联 到 一 个 终端 即 可 。 系 统 调 用 isatty 束 是 用 来 完成 这 一 任务 的 。 
2m nC Anan ee 它 就 可 判断 出 该 描述 符 是 否 连 
过 到 一 个 终端 。 


#include <unistd.h> 


int isatty(int fd); 


如 果 打 开 的 文件 摘 述 符 fd 连 接 到 一 个 终端 ， 则 系统 调用 isatty 返 回 
1， 人 否则 返回 0。 

在 这 个 程序 中 ， 你 使 用 的 是 文件 流 ， 但 isatty 只 能 对 文件 描述 符 进 
行 控 作 。 为 了 提供 必要 的 转换 ， 你 需要 把 isatty 调 用 与 在 第 3 章 中 介绍 
的 feno 函 数 结合 使 用 。 


如 果 stdout (标准 输出 ) 已 被 重 定向 ， 你 该 做 什么 呢 ? 直接 退出 不 

是 一 个 好 办 法 ， 因 为 用 户 无 法 知道 程序 为 什么 会 运行 失败 。 向 stdout 输 

出 一 条 消息 也 不 起 作用 ， 因 为 这 条 消息 也 会 被 重 定向 。 一 种 解决 方法 
是 将 消息 写 到 stderr (标准 错误 输出 ) ， 它 不 会 被 shell 的 >file 命 令 重 定 
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x 验 检查 是 否 存在 输出 重 定向 
沿用 上 面 实验 中 创建 的 menul.c 程 序 ， 在 其 中 加 上 新 的 include 语 
句 ， 对 main 函 数 进 行 如 下 的 修改 ， 并 重新 将 该 程序 命名 为 menu2.C。 


#include <unistd.h> 


int choice = 0; 


if(tisatty(fileno(stdout))) ( 
fprintf(stderr, "You are not a terminal!\n"); 
exit(1); 

} 

do { 


choice = getchoice("Please select an action", menu); 
rintf("You have chosen: %c\n", choice); 
p 


) while(choice !* 'q'); 

exit(0); 
) 

请 看 这 个 程序 给 出 的 样本 输出 : 

S ./menu2 
Choice: Please select an action 
a - add new record 
d delete record 
q - quit 


q 

You have chosen: q 

$ menu2 > file 

You are not a terminal! 


^ 
£ 


实验 解析 
新 代码 段 用 isatty 函 数 来 测试 标准 输出 是 否 已 连接 到 一 个 终端 ， 如 
果 没 有 ， 则 退出 程序 。shell 也 用 同一 神 技术 来 判断 是 否 需要 提供 余 端 


提示 符 。 将 stdout 和 stderr 同 时 重 定 同 也 是 可 能 的 ， 而 且 极 为 常见 。 你 
可 以 像 下面 这 样 把 错误 流 重 定 癌 到 男 一 个 文件 : 
$ ./menu2 >file 2>file.error 
或 者 如 下 面 这 样 ， 将 两 个 输出 流 重 定向 到 同一 个 文件 : 
$ ./menu2 >file 2>&1 
$ 
QU ARRAS PASH BEE TL ATA, HIT AB SEAR A SEDER o TEX 
章 中 ， 我 们 详细 介绍 了 它 的 语法 。 在 本 例 中 ， 你 需要 将 错误 信息 直接 
发 送 到 用 户 终端 上 。 


5.2 ”与 终端 进行 对 ; 


如 果 不 希 望 程序 中 与 用 户 交 互 的 部 分 PALE ETF 但 允许 其 他 的 输 
入 和 输出 被 重 定 癌 ， 你 就 需要 将 与 用 户 交 互 的 部 分 与 stdout、stderr 分 
离开 。 er V ae iid UE TT EE o ERA Ma AE 
统 ， 它 通常 拥有 多 这 些 终 端 或 者 是 直接 连接 的 ， 或 者 是 通 
网 络 进行 连接 的 ， a 、 "你 怎样 才 和 E 找 到 要 使 用 的 正确 终端 呢 ? 

潍 运 的 是 ，Linux 和 UNIX 提 供 了 一 个 特殊 设备 /dev/tty 来 解决 这 一 
问题 ， 该 设备 始终 是 指 问 当 I AEN 前 的 登录 会 话 。 由 于 Linux 把 一 
a ali ad 所 以 你 可 以 用 一 般 文件 的 操作 方式 来 对 /dewtty 
进行 读 写 

在 下 面 的 实验 中 ， 你 通过 癌 getchoice 函 数 传递 参数 的 方法 来 加 强 
对 输出 的 控制 ， 修 改 后 的 程序 为 menu3.c。 


X Uy 使 用 /dev/tty 
以 menu2. c 程 序 为 蓝本 对 其 做 如 下 修改 ， 使 得 输入 和 输出 直接 指 
[H]/dev/tty: 


choice = getchoice(*Please select an action’, menu, input, output); 
printf('You have chosen: $cin", choice); 
| while(choice t= 'q']; 
exit(0); 
) 


int getchoice(char *greet, char *choices[]. PILE *in, FILE *out) 
{ 

int chosen = 0; 

int selected; 

char **oprioni; 


de | 
fprintfilout,."'Choice: W$sin*,greet]; 
option * cboices; 
while[*option! 1 
fprintf(out, "Vs 1n*, *option); 
optiones; 
i 
do { 
selected = fgetc(in); 
} while(selected == 'in'); 
option * Choices; 
while(*option) ( 
ifiselected == *opticon[0]! ( 
chosen = l; 
break; 
| 
option++; 
} 
if{ichosen) | 
fprintf(out,"Incorrect choice, select ogain\n") p 
} 
} whilel!chosen) ! 
return selected; 


现在 ， 当 运 行 这 个 程序 并 将 输出 进行 重 定向 时 ， 你 仍然 可 以 在 终 
端 上 看 到 菜单 提示 信息 ， 但 程序 的 其 他 输出 (如 表明 菜单 项 已 被 选 
Ej 则 被 重 定向 到 文件 中 。 


$ ./menu3 > file 

You are not a terminal, OK. 
Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

d 

Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

q 

$ cat file 

You have chosen: d 

You have chosen: q 


有 时 ， 程 序 需 要 更 精细 的 终端 控制 能 力 ， 而 不 是 仅 通过 人 简单 的 文 
件 操作 来 完成 对 终端 的 一 些 控制 。Linux 提 供 了 一 组 编程 接口 用 来 控制 
终端 磷 动 程序 的 行为 ， 从 而 使 得 更 好 地 控制 终端 的 输入 和 输出 。 


5.3.1 yli 


如 图 5-1 所 示 ， 你 可 以 通过 一 组 函数 调用 〈 通 用 终端 接口 ， 简 称 
GTI) 来 控制 终端 ， 这 组 函数 调用 与 用 于 读 写 数据 的 函数 是 分 离 的 ， 
这 台 使 得 读 写 数 据 的 接口 非常 简 洛 ， 同 时 又 允许 用 户 可 以 对 终端 的 行 
为 进行 更 精细 的 控制 。 但 这 并 不 意味 着 终端 1O 接 口 也 非常 简洁 ， 相 
反 ， 它 需要 文 持 大 量 不 同类 型 的 硬件 。 


内 核 中 的 终端 
开动 程序 


图 51 


用 UNIX 的 术语 来 说 ， 控 制 接口 定义 了 一 个 “线路 规程 "， 它 使 程序 
在 指定 终端 驱动 程序 的 行为 时 拥有 极 大 的 灵活 性 。 

下 面 是 你 能 够 控制 的 主要 功能 。 

口 “ 行 编辑 : 是 否 允 许 用 退 格 键 进 行 编辑 。 

o Bad 征 立 即 读 取 字 符 ， 还 是 等 竺 一 段 可 配置 的 延迟 之 后 再 

读 取 它 们 。 


O Bl: 允许 控制 字符 的 回 显 ， 例 如 读 取 密 码 时 。 

O _ 回 车 /换行 (CR/LF) : 定义 如 何在 输入 /输出 时 映射 回 车 /换行 
符 ， 比 如 打印 字符 时 应 该 如 何 处 理 。 

O XE: 这 一 功能 很 少 用 于 PC 控制 台 ， 但 对 调制 解 调 器 或 通过 
串 行 线 连接 的 终端 殉 很 重要 。 


5.3.2 型 


m ee 你 十 分 有 必要 先 理解 它 所 要 驱动 的 硬 
SUM o 

图 5-2 所 示 的 概念 布局 图 〈 某 些 早 期 UNIX 站 点 的 实际 情况 就 是 这 
样 ) 是 让 一 台 UNIX 机 器 通过 串 行 口 连接 一 台 调 制 解 调 器 ， 再 通过 电话 
线 连接 到 用 户 站 的 调制 解 调 亏 ， 该 调制 解 调 僚 最 终 连 接 到 用 户 的 终 
端 。 事 实 上 ， 这 正 是 某 些 小 型 ISP 《因特网 服务 提供 商 ) 在 因特网 早期 
使 用 的 一 种 配置 情况 。 这 种 连接 方式 可 以 看 作 是 客户 /服务 占 模 型 的 一 
rum 它 用 于 程序 运行 在 大 型 主机 上 上， 而 用 户 工作 在 哑 终 端的 情 
Uy, o 


数据 小 / 写 接 口 | 控制 接口 
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如 果 你 工作 在 一 台 运 行 着 Linux 系 统 的 PC 上 , 可 能 会 认为 这 个 模 
型 过 于 复杂 。 但 因为 本 书 的 两 位 作者 都 有 调制 解 调 器 ， 所 以 如 果 愿 意 
的 话 ， 就 可 以 按照 图 中 的 方式 用 一 对 调制 解 调 器 和 电话 线 将 两 人 的 电 
oo 并 通过 终端 仿真 程序 (minicom) 远程 登录 到 对 方 的 
机 器 上 。 当 然 ， 如 今 的 快速 宽带 接 入 已 让 这 种 类 型 的 连接 方式 过 时 ， 
arr E 其 用 处 。 

使 用 这 样 一 个 硬件 模型 的 好 处 是 ， 绝 大 多 数 现实 世界 中 的 情况 都 
只 是 这 一 最 复杂 情况 的 子 集 。 如 果 这 个 模型 忽略 了 一 些 功 能 ， 那 么 它 
就 不 能 很 好 的 支持 各 种 现实 情况 。 


5.4 termios 结 构 


termios 是 在 POSIX 规 范 中 定义 的 标准 接口 ， 它 类 似 于 系统 V 中 的 


termio 接 口 。 通 过 设置 termios 类 型 的 数据 结构 中 的 值 和 使 用 一 小 组 函 
数 调用 ， 你 就 可 以 对 终端 接口 进行 控制 。termios 数 据 结 构 和 相关 函数 
调用 都 定义 在 头 文件 termios.h 中 。 


如 果 程 序 需 要 调用 定义 在 termios.h 头 文件 中 的 函数 ， 它 就 需 
要 与 一 个 正确 的 函数 库 进 行 链 接 ， 这 个 函数 库 可 能 是 标准 的 C 函 
数 库 或 者 curses 函 数 库 (取决 于 你 的 安装 情况 ) 。 如 果 需 要 ， 在 编 
译本 章 中 的 示例 程序 时 ， 在 编译 命令 的 来 尾 加 上 -lcurses。 在 一 些 
老 版 本 的 Linux 系 统 中 ，curses 库 被 命名 为 new curses。 在 这 种 情况 
下 ， 库 名 和 链接 参数 就 需要 相应 地 改 为 ncurses 和 -lncurses。 


可 以 被 调整 来 影响 终端 的 值 按照 不 同 的 模式 被 分 成 如 下 几 组 : 
输入 模式 

输出 模式 

控制 模式 

本 地 模式 

特殊 控制 字符 

最 小 的 termios 结 构 的 典型 定义 如 下 (X/Open 规范 允许 包公 附加 字 
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段 ) : 


#include <termios.h> 
struct termios { 


tcflag t c_iflag; 
tcflag t c_oflag; 
tcflag t c_cflag; 
tcflag t c lflag; 
cc t c cc[NCCS]; 


); 


AK 


结构 成 员 的 名 称 与 上 面 列 出 的 5 种 参数 类 型 相对 应 。 
你 可 以 调用 函数 tcgetattr 来 初始 化 与 一 个 终端 对 应 的 termios 结 构 , 
数 的 原型 如 下 : 


#include <termios.h> 


int tcgetattr(int fd, struct termios *termios p); 

这 个 函数 调用 把 当前 终端 接口 变量 的 值 写 入 termios_p 参 数 指 同 的 
结构 。 如 条 这 些 值 其 后 被 修改 了 ， 你 可 通过 调用 函数 tcsetattr 来 重新 配 
置 终端 接口 ， 该 函数 的 原型 如 下 : 


Wf include «termios.h» 


int tcsetattr(int fd, int actions, const struct termios *termios p); 


参数 actions 控 制 修改 方式 ， 共 有 3 种 修改 方式 ， 如 下 所 示 。 

O TCSANOW: 立刻 对 值 进 行 修改 。 

口 TCSADRAIN: 等 当前 的 输出 完成 后 再 对 值 进行 修改 。 

O TCSAFLUSH: 等 当前 的 输出 完成 后 再 对 值 进行 修改 ， 但 丢弃 
还 未 从 read 调 用 返回 的 当前 可 用 的 任何 输入 。 


注意 ， 程 序 有 责任 将 终端 设置 恢复 到 程序 开始 运行 之 前 的 状 
态 ， 这 一 点 是 非常 重要 的 。 首 先 保存 这 些 值 ， 然 后 在 程序 结束 时 
恢复 它们 ， 这 永远 是 程序 的 职责 。 


接 下 来 ， 我 们 将 仔细 分 析 各 种 模式 和 相关 的 函数 调用 。 一 些 模 式 
的 细节 非常 星 涩 、 专 业 ， 而 且 很 少 使 用 ， 所 以 我 们 在 此 只 介绍 主要 的 
功能 。 如 果 读 者 需要 了 解 更 多 内 容 ， 请 查阅 man 帮 助手 册 或 POSIX ` 
X/Open 的 规范 文档 。 

你 首先 应 该 了 解 的 是 本 地 模式 ， 它 也 是 最 重要 的 一 种 模式 。 我 们 
在 本 章 中 编写 的 第 一 个 应 用 程序 出 现 了 两 个 问题 ， 其 中 第 二 个 问题 
(用 户 必须 按 下 回 车 键 才能 让 程序 读 取 输入 ) 的 解决 方法 是 使 用 标准 
模式 或 非 标准 模式 ， 即 你 可 以 让 程序 等 待 一 行 输入 完毕 后 再 进行 处 
理 ， 或 让 它 一 有 字符 键入 就 立刻 处 理 。 


5.4.1 输入 模式 


输入 模式 控制 输入 数据 〈 终 端 驱动 程序 从 串 行 口 或 键盘 接收 到 的 
字符 ) 在 被 传递 给 程序 之 前 的 处 理 方式 。 你 通过 设置 termios 结 构 中 
c_iflag 成 员 的 标志 对 它们 进行 控制 。 所 有 的 标志 都 被 定义 为 安 ， 并 可 
通过 按 位 或 的 方式 结合 起 来 。 这 也 是 所 有 终端 模式 都 采用 的 方法 。 

可 用 于 c_iflag 成 员 的 宏 如 下 所 示 。 

O BRKINT. 当 在 输入 行 中 检测 到 一 个 终止 状态 (连接 丢失 ) 
时 ， 产 生 一 个 中 断 。 


IGNBRK: 忽 略 输 入 行 中 的 终止 状态 。 
ICRNL: 将 接收 到 的 回 车 符 转 换 为 新 行 符 。 
IGNCR: 包 略 接收 到 的 回 千 符 。 

INLCR: 将 接收 到 的 新 行 符 转 换 为 回 车 符 。 
IGNPAR: 忽 上 略 奇 偶 校 验 错误 的 字符 。 
INPCK: 对 接收 到 的 字符 执行 奇偶 校 验 。 
PARMRK: 对 奇 俩 校 验 错误 做 出 标记 。 
ISTRIP: 将 所 有 接收 到 的 字符 裁减 为 7 比特 。 
IXOFF: 对 输入 局 用 软件 流 控 。 

IXON: 对 输出 启用 软件 流 控 。 


如 果 BRKINT 和 IGNBRK 标 志 都 未 被 设置 ， 则 输入 行 中 的 终 
止 状态 就 被 读 取 为 NULL (0x00) 字符 。 


用 户 一 般 无 需 频 繁 修改 输入 模式 ， 因 为 它 的 默认 值 通常 整 是 最 合 
适 的 ， 所 以 我 们 在 这 里 就 不 过 多 讨论 了 。 


5.4.2 ”输出 模式 


输出 模式 控制 输出 字符 的 处 理 方式 ， 即 由 程序 发 送出 去 的 字符 在 
传递 到 串 行 口 或 屏幕 之 前 是 如 何 处 理 的 。 正 如 你 预料 的 那样 ， 许 多 处 
理 方式 正好 与 输入 模式 对 应 。 它 还 有 几 个 其 他 标志 ， 主 要 用 于 慢 速 终 
端 ， 因 为 这 些 终端 在 处 理 回 车 符 等 字符 时 需要 花费 一 定 的 时 间 。 几 乎 
所 有 这 些 标志 不 是 多 余 的 (因为 现在 的 终端 速度 比 以 前 要 快 得 多 ) ， 
就 是 用 具有 终端 处 理 能 力 的 terminfo 数 据 库 处 理会 更 有 效 (在 本 章 的 后 
面 你 会 用 到 该 数据 库 ) 。 

你 通过 设置 termios 结 构 中 c_oflag 成 员 的 标志 对 输出 模式 进行 控 
制 。 可 用 于 c_oflag 成 员 的 宏 如 下 所 示 。 

OPOST: 打 开 输 出 处 理 功 能 。 

ONLCR: 将 输出 中 的 换行 符 转 换 为 回 车 /换行 符 。 
OCRNL: 将 输出 中 的 回 车 符 转 换 为 新 行 符 。 
ONOCR: 在 第 0 列 不 输出 回 车 符 。 
ONLRET: 不 输出 回 车 符 。-- 

OFILL: 发 送 填充 字符 以 提供 延 时 。 

OFDEL: 用 DEL 而 不 是 NULL 字 符 作 为 填充 字符 。 
NLDLY: 新 行 符 延 时 选择 o 
CRDLY: 回 车 符 延 时 选择 o 
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TABDLY: 制 表 符 延 时 选择 。 
BSDLY: 退 格 符 延 时 选择 。 
VTDLY: 垂 直 制 表 符 延 时 选择 © 
FFDLY: 换 页 符 延 时 选择 。 


如 果 没 有 设置 OPOST， 则 所 有 其 他 标志 都 被 忽略 。 


由 于 输出 模式 用 得 也 不 多 ， 所 以 我 们 在 此 也 不 做 过 多 的 讨论 。 


9.4.3 


控制 模式 控制 终端 的 硬件 特性 。 你 通过 设置 termios 结 构 中 c_cflag 


工 


成 员 的 标志 对 控制 模式 进行 配置 。 可 用 于 c_cflag 成 员 的 宏 如 下 所 不 。 
口 


口 口 口 口 口 口 口 口 口 


CLOCAL BRE PU Vel SUBE UN ae 8 的 状态 行 。 
CREAD: 启 用 字符 接收 器 

CS5: 发 送 或 接收 字符 时 使 用 5 比特 。 

CS6: 发 送 或 接收 字符 时 使 用 6 比特 。 

CS7: 发 送 或 接收 字符 时 使 用 7 比特 。 

CS8: 发 送 或 接收 字符 时 使 用 8 比特 。 

CSTOPB: 每 个 字符 使 用 两 个 停止 位 而 不 是 一 个 。 
HUPCL: 关 闭 时 挂 断 调制 解 调 器 。 

PARENB: 启 用 奇偶 校 验 码 的 生成 和 检测 功能 
PARODD: 使 用 奇 校 验 而 不 是 侦 校 验 。 


如 果 设 置 了 HUPCL 标 志 ， 当 终端 驱动 程序 检测 到 与 终端 对 应 
的 最 后 一 个 文件 描述 符 被 关闭 时 ， 它 将 通过 设置 调制 解 调 絮 的 控 


制 线 来 挂 断 电 话 线路 。 


控制 模式 主要 用 于 串 行 线 连接 调制 解 调 套 的 情况 ， 虽 然 它 也 可 用 


来 和 终端 进行 "对话 ”。 但 与 通过 使 用 termios 的 控制 模式 来 修改 默认 的 


线路 行为 相 比 ， 直 接 修改 终端 配置 文件 通 肖 更 加 容易 一 些 。 


5.4.4 ”本 地 模式 


本 地 模式 控制 终端 的 各 种 特性 。 你 通过 设置 termios 结 构 中 c_lflag 
成 员 的 标志 对 本 地 模式 进行 配置 。 可 用 于 c_lflag 成 员 的 宏 如 下 所 示 。 


[] 
[] 


deu 


ri 


ECHO: 启 用 输入 字符 的 本 地 回 显 功能 。 


ECHOE: 接收 到 ERASE 时 执行 退 格 、 空 格 、 退 格 的 动作 组 


ECHOK: 接收 到 KILL 字 符 时 执行 行 删 除 操 作 。 
ECHONL: 回 显 新 行 符 。 
ICANON: 启用 标准 输入 处 理 (参见 下 面 的 说 明 ) 
IEXTEN: 局 用 基于 特定 实现 的 函数 。 
ISIG: 启 用 信和 号。 
NOFLSH: 禁 止 清空 队列 。 
O TOSTOP: 在 试图 进行 写 操作 之 前 给 后 台 进 程 发 送 一 个 信和 号。 
这 里 最 重要 的 两 个 标志 是 ECHO 和 ICANON。 前 者 的 作用 是 抑制 
键入 字符 的 回 显 ， 而 后 者 是 将 终端 在 两 个 截然 不 同 的 接收 字符 处 理 模 
式 间 进行 切换 。 如 果 设 置 了 ICANON 标 志 ， 就 启用 标准 输入 行 处 理 模 
式 ， 否 则 ， 就 启用 非 标 准 模 式 。 


5.4.5 _ 特殊 控制 字符 


特殊 控制 字符 是 一 些 字符 组 合 ， 如 Ctrrl+C， 当 用 户 键 入 这 样 的 组 
合 键 上 时， 终端 会 采取 一 些 特殊 的 处 理 方式 。termios 结 构 中 的 c_cc 数 组 
成 员 将 各 种 特殊 控制 字符 映射 到 对 应 的 支持 函数 。 每 个 字符 的 
位 置 ( 它 在 数组 中 的 下 标 ) 是 由 一 个 宏 定 义 的 ， 但 并 不 限制 这 些 字符 
必须 是 控制 字符 。 

根据 终端 是 否 被 设置 为 标准 模式 ( 即 termios 结 构 中 c_lflag 成 员 是 
否 设 置 了 ICANON 标 志 ) ，c_cc 数 组 有 两 种 差别 很 大 的 用 法 。 

要 特别 注意 的 一 点 是 ， 在 两 种 不 同 的 模式 下 ， 数 组 下 标 值 有 一 部 
。 出 于 这 个 原因 ， 你 一 定 要 注意 不 要 将 两 种 模式 各 自 的 下 
IMEEM ° 

下 面 是 在 标准 模式 中 可 以 使 用 的 数组 下 标 。 

VEOF:EOF 字 符 。 
VEOL:EOL 字 符 。 
VERASE:ERASE 字 符 ° 
VINTR:INTR 字 符 。 
VKILL:KILL 字 符 。 
VQUIT:QUIT 字 符 。 
VSUSP: SUSP 字 符 。 
VSTART:START 字 符 。 
VSTOP: STOP 字 符 。 
下 面 是 在 非 标准 模式 中 可 以 使 用 的 数组 下 标 。 
口 VINTR: INTR 字 符 。 
口 VMIN:MIN 值 。 
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VQUIT:QUIT 字 符 。 
VSUSP: SUSP 字 符 。 
VTIME: TIME({E ° 
VSTART:START 7% ° 
VSTOP: STOP 字 符 。 


1. 字符 


由 于 这 些 特 殊 字 符 和 非 标准 值 对 于 输入 字符 的 高 级 处 理 非常 重 
要 ， 所 以 我 们 在 这 里 对 它们 进行 详细 的 解释 ， 如 表 5-1 所 示 。 


表 5-1 


Lil 
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2. TIME 和 MIN 值 


TIME 和 MIN 的 值 只 能 用 于 非 标准 模式 ， 两 者 结合 起 来 共同 控制 对 
输入 的 读 取 。 此 外 ， 两 者 的 结合 使 用 还 能 控制 在 一 个 程序 试图 读 取 与 
一 个 终端 关联 的 文件 摘 述 符 时 将 发 生 的 情况 。 

两 者 的 结合 分 为 如 下 4 种 情况 。 

口 MIN=0 和 TIME=0: 在 这 种 情况 下 ，read 调 用 总 是 立刻 返回 。 

如 果 有 等 待 处 理 的 字符 ， 它 们 职 会 被 返回 ;如 果 没 有 字符 等 竺 处 

理 ，read 调 用 返回 0， 并 且 不 读 取 任何 字符 。 

口 MIN =0 和 TIME >0: 在 这 种 情况 下 ， 只 要 有 字符 可 以 处 理 或 

者 是 经 过 TIME 个 十 分 之 一 秒 的 时 间 间 隔 ，read 调 用 就 返回 。 如 果 

人 read 返 回 0， 和 否则 read 返 回 读 取 的 字 

符 数目 。 

O MIN>0 和 TIME = 0: 在 这 种 情况 下 ，read 调 用 将 一 直 等 等 ， 直 

到 有 MIN 个 字符 可 以 读 取 时 才 返 回 ， 返 回 值 是 读 取 的 字符 数量 。 

到 达 文 件 尾 时 返回 0。 


O MIN >0 和 TIME >0: 这 是 最 复杂 的 一 种 情况 。 当 read 被 调用 
时 ， 它 会 等 待 接收 一 个 字符 。 在 接收 到 第 一 个 字符 及 后 续 的 每 个 
字符 后 ， 一 个 字符 间隔 定时 器 被 启动 (如果 定 时 器 已 在 运行 ， 则 
重启 它 ) 。 当 有 MIN 个 字符 可 读 或 两 个 字符 之 间 的 时 间 间 隔 超 过 
TIME 个 十 分 之 一 秒 时 ，read 调 用 返回 。 这 个 功能 可 用 于 区 分 是 单 
独 按 下 了 Escape 键 还 是 按 下 一 个 以 Escape 键 开始 的 功能 组 合 键 。 
但 要 注意 的 是 ， 网 络 通信 或 处 理 器 的 高 负载 将 使 得 类 似 这 样 的 定 
时 器 失去 作用 。 

通过 设置 非 标 准 模 式 与 使 用 MIM 和 TIME 值 ， 程 序 可 以 逐个 字符 


地 处 理 输入 。 


3. 通过 shell 访 问 终 端 模式 
如 果 在 使 用 shell 时 想 查 看 当前 的 termios 设 置 情况 ， 可 以 使 用 下 面 


的 命令 : 


S stty -a 


在 我 的 Linux 系 统 上 ( 它 对 标准 termios 结 构 进行 了 一 些 扩展 ) ， 这 
个 命令 的 输出 如 下 : 


从 上 面 的 命令 输出 中 ， 你 可 以 看 到 ，EOF 字 符 是 Crl+D 并 且 局 用 


了 本 地 回 显 。 当 在 做 终端 控制 的 练习 时 ， 一 不 小 心 融会 将 终端 设置 为 
非 标准 状态 ， 这 将 使 得 终端 的 使 用 非常 困难 。 下 面 几 种 方法 可 以 帮 你 
摆脱 这 种 困境 。 


第 一 种 方法 是 使 用 如 下 命令 (这 要 求 你 的 stty 版 本 支持 这 种 用 
9s 


$ stty sane 


O 如 果 回 车 键 和 新 行 符 〈 用 于 终止 输入 行 ) 的 映射 关系 丢失 
了 ， 你 可 能 融 需 要 输入 命令 stty sane, 
然后 按 下 Ctm+J (EMT) ， 而 不 是 按 下 回 车 键 Enter 。 


D 第 二 种 方法 是 用 命令 stty-g 将 当前 的 stty 设 置 保存 到 某 种 可 以 重 
新 读 取 的 形式 中 。 使 用 的 命令 如 下 : 


$ stty -g > save stty 


<experiment with settings> 


$ stty $(cat save stty) 


O 注意 ， 对 最 后 一 个 stty 命 令 ， 你 可 能 还 需要 使 用 Ctl+J 的 组 合 
键 来 代替 回 车 键 Enter。 你 也 可 以 在 shell 脚 本 中 使 用 相同 的 方法 : 


«alter stty settings> 
+ 


p 如 果 上 面 两 种 方法 都 不 能 解决 问题 ， 还 有 第 三 种 方法 ， 就 是 
从 另 一 个 终端 登录 ， 用 ps 命令 查找 不 能 使 用 的 那个 shell 的 进程 
号 ， 然 后 用 命令 kill HUP < 进程 号 > 强制 中 止 该 shell。 因 为 系统 总 
ee ee ee 
系统 了 


4. 在 命令 提示 符 下 设置 终端 模式 


你 还 可 以 在 命令 提示 符 下 用 stty 命 令 直接 设置 终端 模式 。 
_ 比 如 说 ， 如 果 想 让 shell 脚 本 可 以 读 取 单 字符 ， 你 就 需要 关闭 终端 
的 标准 模式 ”同时 将 MIN 设 为 1，TIME 设 为 0。 使 用 的 命令 如 下 : 


S stty -icanon min 1 time 0 


INE A iin CBOE n] ALIS I ^ WFR IST BME 
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你 还 可 以 对 第 2 章 的 密码 检查 程序 加 以 改进 ， 在 程序 提示 输入 密码 
前 将 回 显 功能 关闭 。 使 用 的 命令 如 下 : 


$ stty -echo 


eee 
能 再 次 恢复 启用 。 


5.4.6 ”终端 速度 


termios 结 构 提供 的 最 后 一 个 功能 是 控制 终端 速度 ， 但 termios 结 构 
中 并 没有 与 终端 速度 对 应 的 成 员 ， 它 是 通过 函数 调用 来 进行 设置 的 。 
要 注意 的 是 ， 输 入 速度 和 输出 速度 是 分 开 处 理 的 。 

4 个 函数 调用 的 原型 如 下 : 


finclude «termios.h» 


speed t cfgetispeed(const struct termios *); 
speed t cfgetospeed(const struct termios *); 
int cfsetispeed(struct termios *, speed t speed); 
int cfsetospeed(struct termios *, speed t speed); 


注意 ， 这 些 函 数 作 用 于 termios 结 构 ， 而 不 是 直接 作用 于 端口 。 这 
意味 着 ， 要 想 设 置 狐 的 终端 速度 ， 你 就 必须 首先 用 函数 tcgetattr 获 取 当 
前 终端 设置 ， 然 后 使 用 上 述 函 数 之 一 设置 终端 速度 ， 最 后 使 用 函数 
tcsetattr 写 回 termios 结 构 。 只 有 在 调用 了 函数 tcsetattr 之 后 ， 终 端 速度 才 
会 改变 。 

上 面 画 数 调用 中 speed 参 数 可 设置 的 值 很 多 ， 下 面 是 最 重要 的 。 
B0: 挂 起 终端 。 

B1200: 1200 波 特 。 
B2400: 2400 波 特 。 
B9600: 9600 波 特 。 
B19200: 19200 波 特 。 
B38400: 38400 波 特 。 

标准 中 没有 定义 大 于 38400 波 特 的 速度 ， 也 无 标准 方法 用 来 支持 串 

行 口 的 速度 大 于 它 。 


包括 Linux 在 内 的 一 些 操作 系统 ， 为 了 支持 更 高 的 速度 ， 补 充 
定义 了 值 B57600、B115200 和 B230400。 如 果 使 用 的 Linux 版 本 比 
较 低 ， 它 可 能 没有 定义 这 些 值 ， 但 可 以 通过 命令 setserial 来 获取 
57600 和 115200 这 样 的 非 标准 速度 。 要 注意 的 是 ， 在 这 种 情况 下 ， 
只 有 当先 设置 了 B38400 后 ， 才 能 使 用 这 些 速 度 。 这 两 种 方法 都 不 
具备 可 移植 性 ， 所 以 你 在 使 用 它们 时 要 考虑 清楚 。 


5.4.7 HERZ 


在 控制 终端 方面 还 有 一 些 其 他 的 函数 。 它 们 直接 对 文件 描述 符 进 
行 操 作 ， 不 需要 读 写 termios 结 构 。 它 们 的 定义 如 下 : 


OOOOOd 


#include <termios.h> 


int tcdrain(int fd); 
int tcflow(int fd, int flowtype); 
int tcflush(int fd, int in out selector); 


XXE RNA TRE AI RATAN © 

O Wattcdrain (FA ek ite BS. BEATA BEBATU A6) 

出 都 已 发 送 完毕 。 

O “函数 tcflow 用 于 和 暂停 或 重新 开始 输出 。 

口 ”、 函 数 tcflush 用 于 清空 给 入、 输出 或 者 两 者 都 清空 

我 们 已 介绍 完了 termios 结 构 ， 下 面 来 看 几 个 实用 的 例子 。 其 中 最 
D um » 通过 关闭 ECHO 标 志 即 可 做 

| 这 一 点 。 


实 验 使 用 termios 结 构 的 密码 程序 
(1) 密码 程序 password.c 以 下 面 的 定义 开始 : 


include < 


int main 


ct termios initialrsettings, newrsettings: 
IORD LEN + 1]; 


(2) 接 下 来 ， 增 加 一 行 语句 来 获取 标准 输入 的 当前 设置 ， 并 把 这 
些 值 保存 到 刚才 创建 的 termios 结 构 中 : 


tattr alrsettings); 


(3) 对 原始 的 设置 值 做 一 份 副本 以 便 在 程序 结束 时 还 原 设置 。 在 


termios 结 构 变 量 newrsettings 中 关 财 ECHO 标 志 ， 然 后 提示 用 户 输 入 密 
码 : 


initialrsettir 
c ilflag à» -ECHI 


(4) 接 下 来 ， 用 newrsettings 变 量 中 的 值 设置 终端 属性 并 读 取 用 
户 输入 的 密码 。 最 后 ， 将 终端 属性 还 原 到 原来 的 样子 并 输出 刚才 读 取 
的 密码 ， 但 这 让 刚才 的 努力 都 “白费 * 了 〈 这 只 是 为 了 说 明 回 显 功能 恢 
复 了 ， 在 实际 程序 中 不 要 输出 密码 ) 


WORD LEN tdin)r 
setattr(filen t 1 TCSANOW, &initialrsettinga 
fg f (stdout, *\nYou entered tin", password 


运行 这 个 程序 ， 你 将 看 到 如 下 的 输出 : 
$ ./password 

Enter password: 

You entered hello 
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实验 解析 

在 这 个 例子 中 ， 用 户 输入 hello， 但 在 Enter password: 提示 符 后 并 
不 显示 用 户 输入 的 内 容 ， 直 到 用 户 按 下 回 车 键 后 程序 才 有 输出 。 

请 注意 只 修改 你 需要 修改 的 标志 ， 使 用 的 语法 结构 是 X&= ~FLAG 

( 它 的 作用 是 清除 变量 X 中 由 FLAG 标 志 定 义 的 比特 ) 。 如 果 需 要 ， 你 

可 以 用 语法 结构 X | = FLAG 对 由 FLAG 标 志 定 义 的 单个 比特 进行 置 
fi, 虽然 在 上 面 的 例子 中 并 不 需要 这 样 做 。 

在 设置 终端 属性 时 ， 你 用 TCSAFLUSH 丢 弃 用 户 在 程序 准备 好 读 
取 数 据 之 前 输入 的 任何 内 容 。 这 样 的 处 理 方式 是 为 了 培养 用 户 的 一 个 
好 习惯 ， 即 在 回 显 功能 关闭 之 前 不 要 试图 输入 自己 的 密码 。 在 程序 结 
束 之 前 ， 你 还 恢复 了 终端 的 原始 设置 。 

termios 结 构 的 另 一 种 常见 用 法 是 ， 将 终端 设置 为 这 样 一 种 状态 : 
一 旦 输入 字符 ， 程 序 就 立刻 读 取 它 。 这 是 通过 关闭 标准 模式 并 结合 使 
用 MIN 和 TIME 设 置 来 实现 的 。 


实 验 读 取 每 个 字符 
利用 新 学 到 的 知识 ， 你 可 以 对 采 单 程序 做 一 些 修改 。 下 面 的 程序 

menu4.c 基 于 menu3.c， 它 在 后 者 中 插入 了 许多 来 自 password.c 中 的 代 

码 。 修 改 的 内 容 以 阴影 显示 ， 并 在 下 面 的 步骤 中 进行 了 解释 。 

(1) 在 程序 的 开始 ， 必 须 包含 一 个 新 的 头 文件 : 


char *menu[] = { 
"a - add new record", 


"d - delete record", 
"q - quit", 
NULL, 
he 
Scala pda 数 中 声明 一 些 新 变量 : 


e ar “greet, ¢ FILE *in, PILE ‘out 


struct tormios initial settings, new settíngs: 


(3) EVA FgetchoiceER Z5 7. Hi, 


这 些 语句 : 


需要 改变 终端 的 特性 ， 插 入 下 面 


| 
"t 
S8 


tcgetattr[filenolinput),&initisal settings); 
new settings = initial settings; 

new settings.c lflag á= -ICANON: 

new settings.c lflag k= -ECHO; 

new settings.co.co[VMIN] = 1; 

new settíngs.c cc[VTIME] = 0; 


new settings.c.lflag &= -ISIG; 
if(tesetattr(fileno(input), TCSANOW, &new settings) t= 0) [ 


fprinrf|stderr,*could not get attributesin*]:; 
| 


(4) 在 退出 程序 之 前 ， 还 需要 将 终端 属性 还 原 为 原来 的 值 : 


(5) 由 于 在 DL 默认 的 回 车 和 换行 符 之 间 的 映射 已 不 


了 检查 


存在 了 ， 所 以 需要 对 回 车 符 \r 进 行 检查 。 
int getchoice(char *greet, char *choices[], FILE *in, FILE *out] 
( 
int chosen z 0; 
int selected; 


除非 你 做 出 安排 ， 否 则 ， 当 用 户 按 下 Ctrl+C 组 合 键 时 ， 程 序 将 终 
让 人 共用 对 这 些 特殊 字符 的 
处 理 。 要 做 到 这 一 点 ， 你 需要 在 main 函 数 中 增加 如 下 一 条 语句 ， 如 前 
面 的 步 又 所 示 : 


new_settings.c_lflag é= -ISIO 


如 条 将 这 些 修改 放 入 沫 单程 序 ， 则 只 要 用 户 一 键入 字符 吏 会 立刻 
得 到 程序 的 啊 应 ， 而 且 用 户 键入 的 字符 不 会 回 显 。 


$ ./menu4 

Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 


You have chosen: a 

Choice: Please select an action 
a - add new record 

d - delete record 


q - quit 
You have chosen: q 
$ 


如 采 按 下 组 合 键 Crl+C， 它 将 被 直接 传递 给 程序 ， 并 被 程序 认为 
征 一 个 不 正确 的 菜单 选择 。 


5.5 ”终端 的 输出 


通过 使 用 termios 结 构 ， 你 可 以 控制 键 表 的 输入 。 但 我 们 希望 对 程 
序 输出 到 屏幕 上 的 内 容 也 能 具有 同样 的 控制 能 力 。 在 本 章 的 一 开始 ， 
你 用 printf 函 数 将 字符 输出 到 屏 医 上 ， 但 还 没有 办 法 将 输出 的 内 容 放 置 
到 屏幕 上 的 特定 位 置 。 


5.5.1 终端 的 类 型 


许多 UNIX 系 统 都 是 通过 终端 来 使 用 的 ， 虽 然 如 今 在 很 多 情况 
PB, “终端 ?可 能 实际 上 只 是 在 PC 上 运行 的 一 个 终端 仿真 程序 或 者 是 窗 
口 环 境 中 的 一 个 终端 应 用 程序 ， 比 如 X11 中 的 xterm 。 

历史 上 ， 不 同 的 制造 三 商 生 产 了 大 量 的 各 种 类 型 的 硬件 终端 。 虽 
然 它们 几乎 都 用 escape 转 义 序列 (以 escape 字 符 开 头 的 字符 串 ) 来 控制 
光标 的 位 置 和 终端 的 其 他 属性 比如 黑体 和 闪烁 等 ， 但 在 具体 实现 
手段 上 并 没有 统一 的 标准 。 某 些 陈旧 的 终端 还 使 用 不 同 的 卷 屏 方式 ， 
ko inue 也 可 能 不 会 删除 字符 ， 凡 此 


escape 转 义 序 列 有 一 个 ANSI 标 准 ， 它 以 数字 设备 公司 (DEC 
公司 ) 的 VT 系列 终端 所 使 用 的 转 义 序列 为 基础 ， 但 并 不 完全 一 
致 。 许 多 软件 终端 程序 提供 了 对 标准 硬件 终端 如 VT100、 
VT220、ANSI 等 的 仿真 功能 。 


对 程序 员 来 说 ， 如 果 他 希望 编写 一 个 可 以 控制 屏幕 输出 的 软件 ， 
并 且 能 够 运行 在 各 种 类 型 的 终端 之 上 ， 则 硬件 终端 的 多 样 性 是 程序 员 
要 面 对 的 一 个 主要 问题 。 例 如 ，ANSI 终 端 使 用 转 义 序列 Escape,LA 将 
光标 移动 到 上 一 行 ， 而 ADM-3a 终 端 《多 年 前 它 是 一 种 很 汕 见 的 终 
端 ) 只 需 使 用 一 个 控制 字符 Ctrl+K 就 可 以 完成 这 一 任务 。 

编写 能 够 应 付 连 接 到 UNIX 系 统 上 的 各 种 不 同类 型 终端 的 程序 ， 看 
上 去 是 一 项 非 旬 让 人 晨 惧 的 任务 。 这 样 的 程序 必须 针对 每 种 类 型 的 终 
端 编写 相应 的 代码 。 

让 人 欣慰 的 是 ，terminfo 软 件 包 的 出 现 解 决 了 这 一 问题 。 程 序 不 再 
需要 去 迎合 每 种 类 型 的 终端 ， 取 而 代 之 的 是 ， 程 序 通过 查询 终端 类 型 
数据 库 来 找到 正确 的 终端 信息 。 在 大 多 数 现 代 UNIX 系 统 (包括 


Linux) 中 ， 这 个 软件 包 和 另 一 个 软件 包 curses 集 成 在 一 起 。 你 将 在 下 
一 草 学 习 后 者 。 

为 了 使 用 terminfo 函 数 ， 你 通常 需要 在 程序 中 包括 curses 头 文件 
curses.h 和 terminfo 上 自己 的 头 文 件 term.h。 在 一 些 Linux 系 统 上 ， 你 可 能 
不 得 不 使 用 被 称 为 ncurses 的 curses 实 现 ， 并 在 程序 中 包括 ncurses.h 头 文 
件 以 提供 对 terminfo 函 数 的 原型 定义 。 


5.5.2 ”识别 终端 类 型 


Linux 环 境 包 含 一 个 变量 TERM， 它 的 值 被 设置 为 当前 正在 使 用 的 
终 痕 类型。 这 通常 是 由 系统 在 用 户 登 录 时 目 动 设置 的 。 系 统管 理 员 可 
以 针对 每 个 直接 连接 的 终端 设置 默认 的 终端 类 型 ， 对 于 通过 网 络 远程 
连接 的 用 户 ， 可 以 提示 用 户 选 择 目 己 的 终端 类 型 。TERM 环 境 变量 的 
值 可 以 通过 telnet 进 行 协商 ， 并 由 rlogin 程 序 进行 传递 。 

用 户 可 以 通过 查询 shell 来 了 解 ， 从 系统 的 角度 看 上 自己 正在 使 用 的 
终端 是 何 种 类 型 的 ; 

$ echo $TERM 
xterm 


` 
在 这 个 例子 中 ，shell 是 通过 xterm 程 序 (一 个 X 视 窗 系统 中 的 终端 
仿真 程序 ) 或 是 提供 类 似 功能 的 程序 (如 KDE 的 Konsole 或 GNOME 的 
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gnome-terminal) 运行 的 。 

terminfo 软 件 包 包含 一 个 由 大 量 不 同类 型 终端 的 功能 标志 和 escape 
转 义 序列 等 信息 构成 的 数据 库 ， 并 且 为 使 用 它们 提供 了 一 个 统一 的 编 
程 接 口 。 一 个 使 用 这 个 软件 包 的 程序 能 够 随 大 数据 库 的 扩展 来 适应 未 
ales SAISIR] SA mg AY S FES FS T e E M EL ARE 


terminfo 的 功能 标志 由 属性 描述 ， 它 们 被 保存 在 一 组 编译 好 的 
terminfo 文件 中 ， 这 些 文 件 通 常 可 以 TE /usrlib/terminfo 
或 /usr/share/terminfo 目 录 中 找到 。 每 个 终端 (包括 许多 不 同类 型 的 打 
印 机 ， 它 们 也 可 以 通过 terminfo 来 定义 ) 都 有 一 个 定义 其 功能 标志 和 如 
何 访问 其 特征 的 文件 。 为 避免 创建 一 个 很 大 的 目 孙 ， 真 正 的 文件 都 保 
存在 下 一 级 的 子 目录 中 ， 子 目录 名 就 是 终端 类 型 名 的 第 一 个 字母 。 例 
如 ，VT100 终 端的 定义 就 放 在 文件 ...terminfo/wvt100 中 。 


每 个 终端 类 型 对 应 一 个 terminfo 文 件 ， 文 件 格式 是 可 读 的 源 代 码 ， 
然后 通过 tic 命 令 将 源 文件 编译 为 更 加 紧凑 、 有 效 的 格式 ， 以 方便 应 用 
程序 的 使 用 。 奇 怪 的 是 ，X/Open 规 范 提 到 了 源 文件 和 编译 格式 的 定 
义 ， 但 却 未 提 到 把 源 文件 转换 为 编译 格式 的 tic 命 令 。 你 可 以 用 infocmp 
程序 输出 已 编译 terminfo 数 据 项 的 可 读 版 本 。 

下 面 是 VIT100 终 端 对 应 的 terminfo 文 件 的 样本 : 


每 个 terminfo 定 义 由 3 种 类 型 的 数据 项 组 成 。 每 个 数据 项 被 称 为 
capname， 它 们 分 别 用 于 定义 终端 的 一 种 功能 标志 。 

布尔 功能 标志 指出 终端 是 否 支 持 某 个 特定 的 功能 。 例 如 ， 如 果 终 
| 
能 标志 xon 。 

数值 功能 标志 定义 长 度 ， 例 如 : lines 定 义 的 是 屏幕 上 可 以 显示 的 
行 数 ，cols 定 义 的 是 屏幕 上 可 以 显示 的 列 数 。 有 具体 数字 和 功能 标志 名 
之 则 用 字符 # 了 刚 开 。 如 果 要 定义 一 个 有 80 列 24 行 显示 范围 的 终端 ， 可 以 
写 为 cols#80，lines#24。 

字符 串 功 能 标志 稍微 复杂 一 些 。 它 用 来 定义 两 种 截然 不 同 的 终端 
功能 : 用 于 访问 终端 功能 的 输出 字符 串 和 当 用 户 按 下 特定 按键 (通常 
是 功能 键 或 在 数字 小 键盘 上 的 特殊 键 ) 时 终端 接收 到 的 输入 字符 串 。 
有 些 字 符 串 功能 标志 非常 简单 ， 例 如 el 表示 “删除 到 行 尾 "。 在 VT100 终 
端 上 ， 用 于 完成 这 一 功能 的 escape 转 义 序 列 是 Esc,[,K， 在 terminfo 源 文 
件 中 写 为 el=\E[K。 

特殊 键 的 定义 也 采用 类 似 的 方法 。 例 如 ，VT100 终 端 上 的 F1 功 能 
键 发 送 的 escape 转 义 序列 是 Esc, O,P， 它 被 定义 为 kfl=\EOP。 

当 escape 转 义 序列 本 身 还 需要 带 有 参数 时 ， 情 况 会 变 得 更 加 复 
杂 。 大 多 数 终端 都 能 将 光标 移动 到 一 个 特定 的 行列 位 置 。 很 明显 ， 为 


光标 可 能 移动 到 的 每 个 位 置 定义 一 个 功能 标志 是 不 现实 的 ， 解 决 方法 
是 使 用 一 个 通用 的 字符 串 功 能 标志 ， 在 使 用 这 个 字符 串 时 ， 通 过 插入 
参数 来 确定 光标 要 移动 到 的 确定 位 置 。 例 如 ，VT100 终 端 通过 转 义 序 
列 Esc, [,<row>,;,<col>,H 将 光标 移动 到 一 个 特定 位 置 。 在 terminfo 源 文 
件 中 ， 它 被 写 为 相当 复杂 的 字符 串 cup=\E[96i96p196d;96p296dH$<5> 。 
痊 由 了 它 的 含义 。 
: 发 送 Escape 字 符 。 
下 发 送 [字符 。 
%i: 增加 参数 值 。 
%pl: 将 第 一 个 参数 放 入 栈 。 
%d: 将 栈 上 的 数字 输出 为 一 个 十 进 制 数 。 
: 发 送 ;字符 。 
96p2， 将 第 二 个 参数 放 入 栈 。 
%d: KR EDS aan EE 7T DRE TET. o 


这 种 写 潜 看 起 来 非常 复杂 但 它 允 许 参 数 以 固定 的 顺序 排列 ， 与 
终端 期 望 它们 出 现在 最 终 escape 转 义 序列 中 的 顺序 无 关 。%i 的 作用 是 
增加 参数 的 值 ， 它 是 必 不 可 少 的 ， 因 为 标准 的 光标 寻 址 方法 是 将 屏幕 
的 左上 角 看 做 是 (0,0) ， 而 VT100 终 端 把 这 个 位 置 定 义 为 (1,1) 。 最 
后 的 $<5> 表 示 需 要 延迟 一 段 时 间 ， 该 时 间 的 长 度 为 输出 五 个 字符 所 花 
费 的 时 间 ， 终 端 将 利用 这 段 时 间 来 处 理光 标的 移动 。 


我 们 可 以 目 己 定义 许多 功能 标志 ， 但 笠 运 的 是 ， 大 多 数 UNIX 
和 Linux 系 统 已 经 预定 义 好 了 大 部 分 MA mer 标志 。 如 果 需 要 增 
加 一 个 新 终端 ， 你 可 以 在 terminfo 的 手册 页 中 找到 完 整 的 功能 标志 
列表 。 一 种 比较 好 的 方法 是 首先 找到 与 新 终端 类 似 的 一 个 终端 ， 
以 它 为 出 发 点 ， 将 新 终端 定义 为 这 个 已 有 终端 的 变 体 ， 或 者 逐个 
对 新 终端 的 功能 标志 进行 定义 ， 按 需要 修改 它们 。 


除了 terminfo 的 手册 页 以 外 ， 你 还 可 以 参考 由 O’Reilly 出 版 的 
Termcap and Terminfo (作者 是 John Strand、Linda Mui 和 Tim) 。 
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5.5.3 terminfo 功 能 标志 


现在 ， 你 已 知道 如 何 定义 终 MEIDA EB 标志 ， 你 还 需 知 道 如 何 访问 
它们 。 当 使 用 terminfo 时 ， 你 要 做 的 第 一 件 事 情 就 是 调用 Ed SX setupterm 
来 设置 终端 类 型 ， 这 将 为 当前 的 终端 类 型 初始 化 一 个 TERMINAL 结 


构 。 然 后 ， 你 就 可 以 查看 当前 终端 的 功能 标志 并 使 用 它们 的 功能 了 。 
setupterm 吨 数 的 调用 方法 如 下 所 示 : 


#include <term.h> 


int setupterm(char *term, int fd, int *errret); 


setupterm JE Ex ZU 24 Bl Z4 ym AI 79 ZA termdR (AE, AFR 
term 是 空 指 针 ， 就 使 用 环境 变量 TERM 的 值 。 参 数 fd 为 一 个 打开 的 文件 
描述 符 ， 它 用 于 问 终端 写 数 据 。 如 果 参 数 errret 不 是 一 个 空 指 针 ， 则 画 
人 

口 “-1:terminfo 数 据 库 不 存在 。 

口 、0: terminfo 数 据 库 中 没有 匹配 的 数据 项 。 

Es 成 功 

setupterm 函 数 在 成 功 时 返回 常量 OK， 失 败 时 返回 ERR。 如 果 errret 
被 设置 为 空 指针 ，setupterm 画 数 会 在 失败 时 输出 一 条 诊断 信息 并 导致 
程序 直接 退出 ， 就 像 下 面 这 个 例子 : 


petupt 
printf(*Done.in*); 
exit(0); 


在 你 的 系统 中 运行 这 个 程序 的 结果 可 能 和 这 里 给 出 的 不 完全 一 
样 ， 但 含义 是 很 清楚 的 。 字 符 串 Done 不 会 输出 ， 因 为 setupterm 函 数 会 
在 执行 失败 时 导致 程序 直接 退出 。 

$ cc -o badterm badterm.c -lncurses 
$ ./badterm 


'unlisted': unknown terminal type. 
e 


请 注意 这 个 例子 中 的 编译 命令 行 : 在 这 个 Linux 系 统 上 ， 我 们 使 用 
的 是 curses 函 数 库 的 ncurses 实 现 ， 并 使 用 位 于 标准 位 置 的 标准 头 文件 o 
在 这 类 系统 上 ， 你 可 以 直接 在 程序 中 包含 curses.h 头 文件 ， 并 在 编译 时 
为 库 文 件 指 定 -Incurses 选 项 。 

对 于 有 菜单 选择 函数 来 说 ， 你 和 希望 它 能 够 首先 清 屏 ， 然 后 在 屏幕 上 
移动 光标 并 将 数据 写 到 屏幕 的 不 同位 置 。 在 成 功 调用 setupterm 函 数 
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数 对 应 一 个 功能 标志 类 型 : 


#include <term.h> 


int tigetflag(char *capname) ; 
int tigetnum(char *capname) ; 
char *tigetstr(char *capname) ; 


函数 tigetflag、tigetnum 和 tigetstr 分 别 返 回 terminfo 中 的 布尔 功能 标 
志 、 数 值 功 能 标志 和 字符 哩 功能 标志 的 值 。 失 败 时 (例如 ， 某 个 功能 
标志 不 存在 ) ,tigetflag 范 数 返 回 -1, tigetnum ER ZG [H]-2,. tigetstr ER BUR 
E] (char *) -1。 

你 可 以 用 terminfo 数 据 库 来 得 找 当 前 终端 的 显示 区 大 小 ， 下 面 的 程 
序 sizeterm.c 通 过 获取 cols 和 1lines 功 能 标志 来 实现 这 一 功能 : 


int nrows, ncolumns; 


setupterm(NULL, filenoistdout], tint *)0)) 
igetn 
columns = cígetnum|*col I 
printfi*Thie terminal has &d columna and td rowe\n*. ncoluzns, nrows): 
t (0 
echo $TERM 


./sizeterm 


如 果 在 一 台 工作 站 的 一 个 窗口 中 运行 这 个 程序 ， 输 出 结果 将 反映 
当前 窗口 的 大 小 ， 如 下 所 示 : 
$ echo $TERM 
xterm 
$ ./sizeterm 
This terminal has 88 columns and 40 rows 


cC 
wv 


如 果 用 tigetstr 函 数 来 获取 xterm 终 端 类 型 的 光标 移动 功能 标志 cup 
的 值 ， 你 将 会 得 到 一 个 参数 化 的 结果 \E[%pl%d;%p2%dH ° 


这 个 功能 标志 需要 两 个 参数 : 光标 要 移动 到 的 行 号 和 列 号 。 这 两 
个 坐标 都 是 从 0 开始 计算 的 ， (0,0) 表示 屏幕 的 左上 和 角 。 

你 可 以 使 用 tparm 函 数 用 实际 的 数值 替换 功能 标志 中 的 参数 ， 一 次 
2 cree Geir een ge ae 
定义 如 下 : 


#include <term.h> 


char *tparm(char *cap, long pl, long p2, ..., long p9); 


= FA tparm Ee Bf) 35 RF 2X y escapes? SC FF Ia, yo OUR EL A XS 
到 终端 。 有 要 想 正确 地 完成 这 一 操作 ， 你 不 能 通过 printf 函 数 将 字符 串 发 
送 到 终端 ， 而 必须 使 用 系统 提供 的 如 下 几 个 特殊 函数 ， 这 些 函 数 可 以 
正确 地 处 理 终端 完成 一 个 操作 所 需要 的 延 时 : 
#include «term.h» 


int putp(char *const str); 
int tputs(char *const str, int affcnt, int (*putfunc) (int)); 


putp 画 数 在 成 功 时 返回 OK， 失 败 时 返回 ERR。 它 以 一 个 终端 控制 
字符 串 为 参数 ， 并 将 其 发 送 到 标准 输出 stdout 。 
ae 如 果 要 将 光标 移动 到 屏幕 上 的 第 5 行 第 30 列 ， 你 可 以 使 用 如 
UE 


sequence = tpar: 5,30 
c sequence); 


tputs 函 数 是 为 不 能 通过 标准 输出 stdout 访 问 终端 的 情况 准备 的 ， 它 
可 以 指定 一 个 用 于 输出 字符 的 函数 。tputs 函 数 的 返回 值 是 用 户 指定 的 
函数 putfunc 的 返回 结果 。 参 数 affcnt 的 作用 是 表明 受 这 一 变化 影响 的 行 
数 ， 它 一 般 被 设置 为 1。 真 正 用 于 输出 控制 字符 串 的 函数 的 参数 和 返回 
值 类 型 必须 与 putchar 函 数 相 同 。 事 实 上 ， 函 数 调用 putp (string) 就 等 
同 于 函数 调用 tputs (string, 1, putchar) 。 在 下 一 个 例子 中 ， 你 将 看 到 
tputs 函 数 使 用 用 户 指 定 的 输出 函数 的 情况 。 
注意 ， 一 些 老 版 本 的 Linux 将 tputs 范 数 的 最 后 一 个 参数 定义 为 int 
(*putfunc) (char) ， 如 果 是 这 样 ， 你 就 必须 修改 下 面 实 验 中 的 
char to_terminal 函 数 的 定义 。 


如 果 通 过 手册 页 查找 与 tparm 画 数 以 及 终端 功能 标志 相关 的 信 
息 ， 你 可 能 会 看 到 函数 tgoto。 用 该 函数 来 移动 光标 会 更 加 简单 ， 
但 我 们 并 未 使 用 它 ， 原 因 是 在 1997 年 版 的 X/Open 规范 (单一 


UNIX 规 范 版 本 2) 中 并 未 包含 该 函数 的 定义 。 因 此 ， 我 们 建议 读 
者 在 新 编写 的 程序 中 也 不 要 使 用 这 类 函数 。 


癌 菜 单 选 择 函 数 里 添加 屏幕 处 理 功 能 的 准备 工作 已 基本 就 绪 ， 现 
在 唯一 未 提 到 的 就 是 清 屏 操作 。 这 一 操作 可 以 通过 使 用 clear 功 能 标志 
来 完成 ， 它 首先 请 屏 ， 然 后 将 光标 放 到 屏幕 的 左上 角 。 但 有 些 终端 并 
不 文 持 clear 功 能 标志 ， 此 时 ， 你 需要 首先 将 光标 移动 到 屏幕 的 左上 
角 ， 然 后 使 用 命令 ed (delete to end of display， 删 除 到 显示 区 域 结 


尾 ) 。 
将 上 面 这 些 内 容 结 合 在 一 起 ， 你 将 编写 样本 表单 程序 的 最 终 版 本 
screenmenuc， 它 将 把 染 单 选项 <* 画 ”在 屏幕 上 供用 户 选 择 。 


实 验 完整 的 终端 控制 

你 可 以 重新 编写 menu4.c 中 的 getchoice 函 数 以 提供 完整 的 终端 控制 
功能 。 在 下 面 的 程序 清单 中 ， 我 们 省 略 了 main 函 数 ， 因 为 无 需 对 其 进 
行 修 改 。 其 他 与 menu4.c 不 一 致 的 地 方 都 以 灰色 育 景 显示 。 


将 这 个 程序 保存 为 menu5.c。 

实验 解析 

重新 编写 M p pae 内 容 与 前 面 的 例子 完全 一 
样 ， 但 其 屏幕 输出 部 分 进行 了 修改 以 充分 利用 terminfo 的 功能 标志 “。 在 
用 户 进行 下 一 次 选择 前 ， 程 序 会 有 清 屏 操作 ， 如 果 想 在 清 屏 之 前 让 信 
息 You have chosen: 在 屏幕 上 多 停留 一 会 儿 ， 你 可 以 在 main 函 数 中 增 
加 一 条 调用 sleep 函 数 的 语句 ， 如 下 所 示 : 


jet ice[("Flense eiect a 1 ion nen input itput 


这 个 程序 里 的 最 后 一 个 函数 char_ to terminal S f XT putc K ZB 
调用 ， 我 们 将 在 第 3 章 介 "s 为 使 本 章 内 容 更 加 完整 ， 我 们 再 


看 一 个 如 何 检测 用 户 击 键 动作 的 程序 示例 。 


Ld 


5.6 rill 


曾经 为 MS-DOS 编 写 程序 的 人 们 经 常会 在 Linux 系 统 中 寻找 一 个 与 
kbhit 函 数 等 同 的 函数 ，kbhit 函 数 可 在 没有 实际 进行 读 操作 之 前 检测 是 
否 茶 个 键 被 按 过 。 遗 憾 的 是 ， 他 们 找 不 到 这 样 的 画 数 ， 因 为 Linux 系 统 
中 没有 与 其 直接 等 同 的 函数 。 但 UNIX 程 序 员 对 此 并 不 在 意 ， 因 为 在 
UNIX 下 编写 的 程序 几乎 不 或 很 少 忙于 等 待 菜 个 事件 的 发 生 。 由 于 
kbhit 函 数 的 主要 用 途 束 是 等 待 某 个 击 键 动作 的 发 生 ， 所 以 在 UNIX 和 
Linux 系 统 上 未 实现 类 似 的 函数 。 

但 当 需 要 移植 MS-DOS 下 的 程序 时 ， 如 果 能 够 模拟 kbhit 函 数 所 完 
成 的 功能 将 会 很 方便 。 你 可 以 用 非 标准 输入 模式 来 实现 它 。 


Sc 验 你 自己 的 kbhit 画 数 

(1) 程序 开始 是 标准 的 程序 头 和 一 组 对 终端 设置 结构 的 声明 ， 变 
量 peek_character 将 用 在 测试 击 键 动作 的 代码 中 ， 然 后 是 程序 后 面 会 用 
到 的 一 些 函 数 的 原型 定义 。 


(2) main 函 数 首先 调用 init_keyboard 函 数 来 配置 终端 ， 然 后 每 隅 
一 秒 循环 调用 — I kbhit ER 2 ° AH 末 按 键 为 q ， 束 退出 循环 并 调用 
close_keyboard 函 数 恢复 终端 为 标准 模式 ， 最 后 退出 程序 。 


printti 


sieepíl) 
if(kbhit()) ( 
ch = readchi!; 


printf(*yoo hit 
} 


close_keyboard(); 
exit(0); 


(3) init_keyboard 函 数 和 close_keyboard 函 数 分 别 在 程序 的 开始 和 
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icin’, ch); 


结束 对 终端 进行 配置 。 


void inít keyboard|] 


{ 


togetattr(0, initial settings]: 
new_settings = initial settings; 


new _settings.c_iflag k= 
new settings.c liflag &- 
new settings.c lflag b= 


-ICANON; 
-BCHO; 
-ISId; 


new settings.c cc[VMIN] = 1; 
new settings.c cc[VTIME] = 0: 
tcoetattr(0, TCSANOW, &new settings); 
] 
void close keyboardi] 
[ 


tcsetattr(0, TCSANOW, &initial settings): 


(4) 下 面 就 是 检测 是 否 有 击 键 动 作 的 kbhit 函 数 : 


1 
t 


} 


char ch 
int mreed; 


if(peek character ‘= -1| 

return 1; 
new settings.c cc[VMIN] v2; 
tcsetattr(0, TCSANOW, &new settings): 
nresd = read(0,&ch, 1]; 
new settings.c cc[VMIN]z-1; 
tcoetattr|0O, TCSANOW, new settings)! 


if|nread == 1) | 
peek character = ch; 
return 1; 

} 


return 0 


(5) 按键 对 应 的 字符 由 下 一 个 函数 readch 读 取 ， 
peek_character 重 置 为 -1 以 进入 下 一 次 循环 。 


int readch/ 
f 


ni 
阔 
ay 
Ke 
ral 


char ch; 

if(peek character {= -1) | 
ch = peek character; 
peek character = -1; 
return ch; 


) 
read(0, &ch,11 ; 
return ch: 


运行 这 个 程序 ， 你 将 看 到 如 下 的 输出 结 采 : 


$ ./kbhit 

looping 

looping 

looping 

you hit 

looping 

looping 

looping 

you hit d 

looping 

you hit q 

$ 

实验 解析 

init_keyboard 苏 数 将 终端 配置 为 “<read 调 用 直到 有 字符 可 以 读 取 时 
才 返 回 ” 的 工作 模式 ae 1, TIME-0) 。kbhit 函 数 将 这 个 模式 修改 
为 "read 调用 检查 输入 并 立刻 返回 ”的 工作 模式 (MIN=0, TIME-0) ° 
a oot 省 的 初始 设置 。 

在 kbhit 页 数 中 ， 你 实际 上 已 将 按键 对 应 的 字符 读 取 了 ,但 
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n 
m] 


5.7 j 台 


Linux 提 供 了 虚拟 控制 台 的 功能 ， 一 组 终端 设备 共享 PC 电脑 的 屏 
幕 、 键 盘 和 鼠标 。 通 常情 况 下 ， 一 个 Linux 安 装 将 配置 8 个 或 12 个 虚拟 
控制 台 。 虚 拟 控 制 台 通过 字符 设备 文件 /dev/ttyN 使 用 ， 其 中 NN 代表 一 个 
数字 ， 从 1 开始 。 

如 果 使 用 字符 界面 登录 Linux 系 统 ， 在 Linux 局 动 并 运行 后 ， 你 首 
先 会 看 到 - -个 login 提 示 符 ， 在 输入 用 户 名 和 和 密码 登录 后 ， 你 所 使 用 的 
终端 设备 就 是 系统 中 的 第 一 个 虚拟 控制 台 ， 即 终端 设备 /dev/tty1 ° 

使 用 命令 who 和 ps， 你 即 可 看 到 目前 登录 进 系统 的 用 户 ， 以 及 在 
这 个 虚拟 控制 台 上 运行 的 shell 和 执行 的 程序 : 


$ who 
neil ttyl Mar 8 18:27 
5 ps -e 
PID TTY TIME CMD 
1092 ttyl 00:00:00 login 
1414 ttyl 00:00:00 bash 
1431 ttyl 00:00:00 emacs 


你 可 以 看 到 用 户 neil 已 登录 进 系 统 ， 并 在 虚拟 控制 台 /dev/ttyl1 上 运 
行程 序 emacs ° 

Linux 系 统 通常 在 前 6 个 虚拟 控制 台 上 运行 一 个 getty 进 程 ， 这 样 用 
户 即 可 用 同一 个 屏幕 、 键 盘 和 鼠标 在 6 个 不 同 的 虚拟 控制 台 上 登录 。 你 
可 以 用 ps 命令 看 到 getty 进 程 ; 


$ ps -e 

PID TTY TIME CMD 

1092 ttyl 00:00:00 login 
1093 tty2 00:00:00 mingetty 
1094 tty3 00:00:00 mingetty 
1095 tty4 00:00:00 mingetty 
1096 tty5 00:00:00 mingetty 
1097 tty6 00:00:00 mingetty 


你 可 以 看 到 ，SuSE Linux 系 统 默 认 的 getty 程 序 mingetty 运 行 在 另外 
5 个 虚拟 控制 台 上 ， 并 等 待 用 户 的 登录 。 


你 可 以 通过 一 个 特殊 的 组 合 键 Ctrl+Alt+F<N> 在 不 同 的 虚拟 控制 台 
之 间 进 行 切换 ， 其 中 N 是 你 希望 切换 到 的 虚拟 控制 台所 对 应 的 数字 。 
例如 ， 如 果 想 切换 到 第 2 个 虚拟 控制 台 ， 你 就 按 下 组 合 刍 Alt+Ctrl+F2， 
按 下 组 合 键 Ctrl+AltrF1 将 返回 到 第 一 个 虚拟 控制 台 。 GER: MEG 
符 界 面 而 不 是 图 形 界 面 进 行 虚 拟 控 制 台 的 切换 时 ， 需 要 使 用 组 合 键 
AlttF<N>—2_. ) 

如 果 Linux 系 统 使 用 的 是 图 形 登 录 界 面 ， 例 如 通过 startx 程 序 或 通 
过 视窗 管理 颖 xdm, X 视 窗 系 统 将 使 用 第 一 个 未 使 用 的 虚拟 控制 台 ， 通 
常 是 /dev/tty7。 在 使 用 X 视 窗 系 统 时 ， 你 可 以 用 组 合 键 Ctrlt+Alt+F<N> 
切换 到 字符 控制 台 ， 用 组 合 键 Ctrl+Alt+F7 切 换 回 X 视 窗 系 统 。 

你 可 以 同时 在 Linux 系 统 上 运行 多 个 X 视 窗 会 话 ， 如 下 所 示 : 


S startx -- :1 


Linux 将 在 下 一 个 未 使 用 的 虚拟 控制 台 上 启动 Xx 服务 器 ， 在 此 例 
中 ， 下 一 个 未 使 用 的 控制 台 是 /dev/tty8， 然 后 ， 你 即 可 用 组 合 键 
Ctrl+Alt+F8 和 Ctrl+Alt+F7 在 两 个 虚拟 控制 台 之 间 进 行 切换 。 

在 其 他 方面 ， 虚 拟 控制 台 的 行为 都 与 普通 硬件 终端 一 样 。 如 果 一 
个 进程 拥有 正确 的 权限 ， 它 即 可 打开 一 个 虚拟 控制 台 ， 采 用 与 读 写 普 
通 硬件 终端 一 样 的 方式 对 其 进行 读 写 。 


5.8 HA 


许多 类 UNIX 系 统 ， 包 括 Linux， 都 有 一 个 被 称 为 伪 终 端的 功能 ° 
这 些 终端 的 行为 与 我 们 在 本 章 所 用 的 终端 非常 相似 ， 唯 一 区 别 是 伪 终 
端 没 有 对 应 的 硬件 设备 。 它 们 可 以 用 来 为 其 他 程序 提供 终端 形式 的 接 
O o 


例如 ， 两 个 象棋 程序 可 以 通过 伪 终 端 进行 对 弈 ， 尽 管 程序 本 身 是 
为 与 人 类 棋 手 通过 实际 终端 进行 对 奔 而 设计 的 。 这 需要 有 个 应 用 程序 
作为 中 介 ， 它 将 一 个 程序 的 棋子 走 法 传递 给 另 一 个 程序 ， 反 之 亦 然 。 
介 程 序 通 过 伪 终 端 来 欺骗 象棋 程序 ， 让 它 在 没有 实际 终端 的 情况 下 

常 运行 。 

过 去 ， 伪 终端 都 是 以 系统 特定 的 方式 实现 的 ， 但 现在 它们 已 被 合 

并 到 单一 UNIX 规 范 中 ， 称 为 UNIX98 伪 终端 或 PTY。 


5.9 小结 


- 


在 本 章 中 ， 你 学 习 了 对 终端 进行 控制 的 三 个 不 同方 面 。 在 本 章 的 
第 一 部 分 ， 你 学 习 了 如 何 检测 重 定 同 ， 如 何 直接 与 终端 进行 对 话 ， 即 
使 在 标准 文件 描述 符 被 重 定 加 的 情况 下 。 你 了 解 了 终端 的 硬件 模型 及 
其 历史 演变 过 程 。 接 下 来 ， 你 学 习 了 通用 终端 接口 和 termios 结 构 ， 后 
者 提供 了 对 Linux 终 端 处 理 的 细 下 控制。 你 还 学 习 了 terminfo 数 据 库 及 
其 相关 函数 的 使 用 方法 ， 它 们 以 终 问 独立 的 方式 来 管理 屏 磋 输出 。 然 
后 ， 你 学 习 了 如 何 立 刻 检测 用 户 的 击 键 。 最 后 ， 你 学 习 了 Linux 的 虚拟 
控制 台 和 伪 终 端 。 


-由 英文 单词 curse 是 只 语 的 意思 。 译 者 注 

L 原文 为 A newline also does a carriage retum ， 这 里 的 译文 是 参考 
Linux 在 线 帮 助手 册 man termios 中 的 解释 ， 原 文 为 Don*t output CR。 译 
者 认为 在 线 帮助 手册 中 的 解释 更 清楚 。 译 者 注 

-中 原文 为 使 用 组 合 键 Ctl+F<N>， 似 有 误 ， 实 际 上 ， 在 使 用 字符 界面 
时 ， 最 党 用 的 虚拟 控制 台 切 换 组 合 键 是 Alt+F<N>， 

译 者 注 


在 第 5 章 中 你 学 习 了 如 何 加 强 对 字符 输入 的 控制 ， 以 及 如 何以 
终端 无 天 的 方式 提供 字符 输出 。 使 用 通用 终端 接口 (GTI 或 termios) 
和 通过 tparm 及 其 相关 函数 控制 escape 转 义 序列 都 存在 一 个 问题 ， 那 就 
是 它们 需要 使 用 大 量 的 底层 代码 。 对 大 多 数 程序 来 说 ， 它 们 更 需要 的 
是 一 个 高 层 接口 。 我 们 希望 能 够 答 单 绘制 屏幕 ， 并 能 用 一 组 函数 目 动 
处 理 与 终端 相关 的 问题 。 

在 本 章 中 ， 你 就 将 学 习 函 数 库 curses。curses 标 准 作为 一 个 重要 的 
过 渡 ， 位 于 简单 的 文本 行程 序 和 完全 图 形 化 界面 (一 般 也 更 难于 编 
程 ， 的 X 视 窗 系统 程序 (如 GTK+/GNOME 和 QVKDE) 之 间 。Linux 还 
提供 svgalib 函 数 库 (一 个 底层 图 形 函 数 库 ) ， 但 它 并 不 是 UNIX 的 标准 
函数 库 ， 因 此 ， 在 其 他 类 UNIX 操 作 系 统 中 一 般 并 未 提供 该 函数 库 。 许 
多 全 屏幕 的 应 用 程序 都 使 用 curses 函 数 库 ， 它 易于 使 用 ， 并 且 提 供 了 终 
端 无 天 的 方式 来 编写 全 屏幕 的 基于 字符 的 程序 。 在 编写 这 类 程序 时 ， 
使 用 curses 函 数 库 总 是 比 直 接 使 用 escape 转 义 序 列 要 容易 得 多 。curses 
还 可 以 管理 键盘 ， 它 还 提供 了 一 种 简单 易 用 的 非 阻塞 字符 输入 模式 。 

读者 可 能 会 发 现 ， 在 Linux 探 制 台 上 运行 本 章 中 的 一 些 例子 时 ， 并 
不 总 是 能 够 获得 预期 的 效果 。 这 是 因为 ， 当 curses 函 数 库 和 控制 台 终 端 
定义 的 结合 出 现 偏差 时 ， 使 用 curses 范 数 认 的 程序 的 输出 结果 就 会 有 些 
问题 ， 但 如 果 在 X 视 窗 系统 的 xterm 窗 口中 运行 这 些 例子 ， 其 输出 结果 
束 与 你 预期 的 完全 一 样 了 。 

本 章 将 介绍 以 下 几 方 面 的 内 容 : 

O curses KUERE H 
curses 函 数 库 的 概念 
基本 的 输入 输出 控制 
多 窗口 的 使 用 
keypad 模 式 的 使 用 
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D 彩色 显示 
在 本 章 最 后 ， 我 们 将 用 C 语 言 重 新 实现 CD 唱片 管理 程序 ， 将 其 作 
为 对 目前 为 止 所 学 知识 的 一 个 总 结 。 


6.1 curses 


curses EX Zt E BES Do 4 JC Py A D H a as R A ak HT I] 
Br, MAERO Y V pa SH FA tg AZ TRA EFA oo REALE EF NE 
终端 和 慢 速 调制 解 调 器 的 年 代 ， 输 出 字符 的 数量 已 显得 不 那么 重要 ， 
但 curses 函 数 库 仍 是 程序 员工 具 箱 中 一 个 有 用 的 工具 。 

于 curses 是 一 个 函数 库 ， 所 以 在 需要 使 用 它 时 ， 你 必须 在 程序 中 
包含 对 应 的 头 文 件 、 男 数 声 明和 宏 定 义 。curses 函 数 库 有 多 种 不 同 的 实 
现 版 本 ， 最 早 的 版 本 出 现在 BSD 版 本 的 UNIX 系 统 中 ， 后 来 被 集成 到 系 
统 V 风 格 的 UNIX 系 统 中 ， 其 后 义 由 X/Open 组 织 对 curses 进 行 了 标准 
化 。Linux 使 用 的 curses 版 本 是 ncurses ( 义 称 为 new curses) ， 它 是 在 
Linux 系 统 上 开发 的 、 针 对 系统 V 版 本 4.0 上 curses 函 数 库 的 免费 仿真 软 
件 。 这 个 版 本 可 以 方便 地 移植 到 其 他 UNIX 版 本 中 ， 虽 然 它 还 包括 了 一 
些 附加 的 不 可 移植 的 功能 。 现 在 甚至 还 有 针对 MS-DOS 和 Windows 系 
统 的 curses 版 本 。 如 果 使 用 的 UNIX 系 统 目 带 的 curses 函 数 库 不 文 持 某 些 
功能 ， 你 可 以 党 试 获取 一 份 ncurses 函 数 库 来 替换 它 。Linux 用 户 通 芝 都 
会 发 现 系 统 已 预 装 好 了 ncurses 函 数 库 ， 或 至 少 安装 好 了 运行 基于 curses 
函数 库 的 程序 所 需 的 组 件 。 如 果 ncurses 的 开发 函数 库 并 没有 在 Linux 发 
行 版 中 预 装 〈 系 统 中 没有 头 文 件 curses.h 或 用 于 链接 的 curses 库 文 
件 ) ， 它 们 通常 会 以 一 个 标准 软件 包 的 形式 存在 于 大 多 数 主要 的 Linux 
发 行 版 中 ， 例 如 ， 它 可 能 被 命名 为 libncurses5-dev ° 


X/Open 规 范 定义 了 两 个 级 别 的 curses 画 数 库 : Æ% curses K 
数 库 和 扩展 curses 函 数 库 。 扩 展 curses 函 数 库 包 含 一 组 混杂 的 附加 
本 数 ， 比 如 处 理 多 列 字 符 和 欣 制 颜色 的 函数 。 除 在 本 章 的 后 面 会 
讨论 颜色 的 使 用 外 ， 我 们 主要 介绍 的 都 是 基本 curses 事 数 。 


当 对 使 用 curses 函 数 库 的 程序 进行 编译 时 ， 你 必须 在 程序 中 包含 头 
文件 cursesh， 并 在 编译 命令 行 中 用 -lcurses 选 项 来 链接 curses 函 数 库 。 
在 许多 Linux 系 统 中 ， 你 可 以 直接 使 用 curses， 但 你 会 发 现实 际 使 用 的 
是 更 好 的 、 更 新 的 ncurses 实 现 版 本 。 

你 可 以 检查 自己 的 curses 的 配置 情况 ， 命 令 

Is -1 /usr/include/*curses.h 
用 来 查看 curses 头 文件 ， 命 令 


Is -1 /usr/lib/lib*curses* 


用 来 检查 库 文件 。 如 果 发 现 头 文件 curses.h 和 ncurses.h 都 只 是 链接 文 
件 ， 而 且 系 统 中 存在 一 个 ncurses 库 文件 ， 那 么 你 就 可 以 使 用 如 下 命令 
来 编译 本 章 中 的 程序 : 

$ gcc program.c -o program -lcurses 

但 如 果 curses 配 置 并 未 目 动 使 用 ncurses 函 数 库 ， 那 么 你 可 能 不 得 不 
在 程序 中 明确 包含 头 文 件 ncurses.h 而 不 是 curses.h 来 强制 使 用 ncurses 男 
数 库 ， 同 时 需要 执行 如 下 的 编译 命令 : 

$ gcc -I/usr/include/ncurses program.c -o program -Incurses 


其 中 ，-I 选 项 用 于 指定 搜索 头 文件 的 目 了 永 。 


在 可 下 载 的 源 代码 中 包含 的 Makefile 文 件 默认 会 假设 你 的 配 
置 使 用 的 是 curses， 如 有 果 你 的 系统 不 是 这 种 情况 ， 你 必须 修改 该 文 
件 或 手工 编译 本 章 的 程序 。 


如 果 不 能 确认 你 的 系统 中 的 curses 究 竟 是 如 何 配置 的 ， 你 可 以 参考 
ncurses 的 手册 页 或 查看 其 他 在 线 文 档 ， 和 常见 的 在 线 文 档 目 隶 位 
于 /usr/share/doc/ 之 下 。 在 该 目录 中 ， 你 会 发 现 curses 或 ncurses 子 目录 ， 
通常 在 该 名 称 后 面 还 会 附加 版 本 号 。 


6.2 “curses 术 语 


curses 例 程 工作 在 屏幕 、 窗 口 和 子 窗 口 之 上 上。 所谓 屏幕 束 是 你 正在 
写 的 设备 (通常 是 终端 屏幕 ， 也 可 能 是 xterm 屏 幕 ) 。 屏 幕 占 据 了 设备 
上 全 部 的 可 用 显示 面积 ， 当 然 ， 如 果 设 备 是 X 视 窗 中 的 一 个 终端 窗 
口 ， 则 屏幕 束 是 该 终端 窗口 内 所 有 可 用 的 字符 位 置 。 无 论 何 时 ， 至 少 
存在 一 个 curses 突 口 ， 我 们 称 之 为 stdscr， 它 与 物理 屏幕 的 尺寸 完全 一 
样 。 你 可 以 创建 一 些 尺 寸 小 于 该 屏幕 的 窗口 ， 答 口 可 以 互相 重 登 ， 它 
们 还 可 以 拥有 目 己 的 多 个 子 窗口 ， 但 每 个 子 窗口 必须 总 是 被 包含 在 它 
的 父 窗 口内 。 

curses 函 数 库 用 两 个 数据 结构 来 映射 终端 屏幕 ， 它 们 是 stdscr 和 
curscr。 两 者 中 ，stdscr 更 重要 一 些 ， 它 会 在 curses 函 数 产生 输出 时 被 刷 
渐 。stdscr 数 据 结构 对 应 的 是 “标准 屏幕 ">， 它 的 工作 方式 与 stdio 函 数 库 
中 的 标准 输出 stdout 韭 常 相似 。 它 是 curses 程 序 中 的 默认 输出 窗口 。 
curscr 数 据 结构 和 stdscr 相 似 ， 但 它 对 应 的 是 当前 屏幕 的 样子 。 在 程序 
调用 refresh 了 范 数 之 前 ， 输 出 到 stdscr 上 的 内 容 不 会 显示 在 屏幕 上 。 
curses 函 数 库 会 在 refresh 函 数 被 调用 时 比较 stdscr 《屏幕 将 会 是 什么 样 
T) 与 第 二 个 数据 结构 curscr (屏幕 当前 的 样子 ) 之 间 的 不 同 之 处 ， 然 
后 用 这 两 个 数据 结构 之 间 的 差异 来 刷新 屏幕 。 

有 的 curses 程 序 需要 知道 curses 维 护 的 stdscr 结 构 ， 因 为 有 些 curses 
函数 需要 以 该 结构 为 参数 。 但 真正 的 stdscr 结 构 是 与 具体 实现 相关 的 ， 
它 决 不 能 被 直接 访问 。curses 程 序 无 需 使 用 curscr 数 据 结构 。 

综 上 所 述 ， 在 curses 程 序 中 输出 字符 的 过 程 如 下 所 示 。 

(1) 使 用 curses 函 数 刷新 逻辑 屏幕 。 
(2) 要求 curses 用 refresh 函 数 来 刷新 物理 屏幕 。 

除了 易于 编程 以 外 ， 分 成 两 个 步 又 来 完成 字符 输出 的 好 处 还 在 
于 ，curses 屏 幕 的 刷新 效率 很 高 。 虽 然 这 点 对 欣 制 人 台 屏 幕 来 说 并 不 重 
要 ， 但 如 果 你 是 通过 慢 速 网 络 连 接 到 主机 上 来 运行 程序 ， 则 屏幕 刷新 
效率 的 提高 意义 就 很 大 了 。 

一 个 curses 程 序 会 多 次 调用 逻辑 屏幕 输出 机 数 ， 例 如 在 屏幕 上 移动 
光标 到 达 正 确 的 位 置 ， 然 后 输出 文本 、 绘 制 线 框 。 在 程序 执行 的 某 些 
阶段 ， 用 户 需 要 看 到 全 部 的 输出 结果 。 这 时 curses 一 般 会 通过 调用 
refresh 函 数 计算 出 让 物理 屏幕 和 逻辑 屏幕 相对 应 的 最 佳 途径 。curses 通 
过 使 用 合适 的 终端 功能 标志 及 优化 光标 的 移动 来 刷新 屏幕 ， 与 立刻 执 
行 所 有 的 屏幕 写 操作 相 比 ，curses 所 需要 输出 的 字符 要 少 得 多 。 


逻辑 屏幕 的 布局 通过 一 个 字符 数组 来 实现 ， 它 以 屏幕 的 左上 角 
— hs (0,0) 为 起 点 ， 通 过 行 号 和 列 号 来 组 织 ， 如 图 6-1 所 示 。 


所 有 的 curses 函 数 使 用 的 坐标 都 是 y 值 〈 行 号 ) 在 前 、x 值 ( 列 号 ) 
在 后 。 每 个 位 置 不 仅 包含 该 屏幕 位 置 处 的 字符 ， 还 包含 它 的 属性 。 可 
显示 的 属性 依赖 物理 终端 的 功能 标志 ， 但 一 般 至 少 会 支持 粗 体 和 下 划 
线 这 两 个 属性 。Linux 控 制 台 通常 还 支持 反 白 显示 和 色彩 属性 ， 后 面 将 
介绍 这 方面 的 内 容 。 

由 于 curses 函 数 库 在 使 用 时 需要 创建 和 删除 一 些 临 时 的 数据 结构 ， 
所 以 所 有 的 curses 程 序 必须 在 开始 使 用 curses 范 数 库 之 前 对 其 进行 初始 
化 ， 并 在 结束 使 用 后 允许 curses 恢 复原 先 设置 。 这 两 项 工作 是 由 initscr 
和 endwin 函 数 分 别 完成 的 。 


x 验 一 个 “Hello World” cursest# hr 
在 本 例 中 ， 你 将 编写 一 个 非常 简单 的 curses 程 序 screen1.c， 来 显示 
Es 些 及 其 他 一 些 基 本 函数 的 使 用 方法 。 然 后 我 们 再 介绍 它们 的 函数 原 


(1) 在 程序 里 加 上 curses.h 头 文件 ， 在 main 画 数 中 增加 初始 化 和 
coca iuis. 数 调用 : 


(2) 在 初始 化 和 重 置 操 作 之 间 ， 增 加 将 光标 移动 到 逻辑 屏幕 上 坐 
标 (5,15) 处 、 输 出 “Hello World”， 然 后 刷新 物理 屏幕 的 代码 。 最 
OS a (2) 将 程序 暂停 两 秒 钟 ， 以 便 在 程序 结束 前 看 到 
便 出 的 结 


运行 程序 时 你 将 在 空白 屏幕 的 左上 部 分 看 到 “Hello World” 字 符 
串 ， 如 图 6-2 所 示 。 


rick@locathost:~/bip4e/chos6 
file Edi View Terminal Tabs Help 


Hello World 


实验 解析 
这 个 程序 初始 化 curses 函 数 库 ， 将 光标 移动 到 屏幕 上 的 某 个 位 置 ， 
然后 显示 一 些 文 本 。 稍 停 片 刻 后 ， 它 关闭 curses 函 数 库 并 退出 。 


6.3 


正如 你 所 看 到 的 ， 所 有 的 curses 程 序 必须 以 initscr 函 数 开 始 ， 以 
endwin 函 数 结 束 。 下 面 是 它们 的 头 文件 定义 : 


#include <curses.h> 


WINDOW *initscr(void); 
int endwin(void); 


initscr 函 数 在 一 个 程序 中 只 能 调用 一 次 。 如 果 成 功 ， 它 返回 一 个 指 
Eram 的 指针 ;如果 失败 ， 它 就 输出 一 条 诊断 错误 信息 并 使 程序 
Sh tlie 

endwin 函 数 在 成 功 时 返回 OK， 和 失败 时 返回 ERR。 你 可 以 先 调用 
endwin 函 数 退 出 curses， 然 后 通过 调用 clearok (stdscr,1) 和 refresh 函 数 
继续 curses 控 作 。 这 实际 上 是 首先 让 curses 访 记 物 理 屏 幕 的 样子 ， 然 后 
强迫 它 执行 一 次 完整 的 屏幕 原文 重 现 。 


6.3.1 出 到 


curses 函 数 库 提供 了 一 些 用 于 刷新 屏幕 的 基本 函数 ， 它 们 是 : 


include «curses.h» 


int addch(const chtype char to add); 

int addchstr(chtype *const string to add); 

int printw(char *format, ...); 

int refresh(void); 

int box(WINDOW *win ptr, chtype vertical char, chtype horizontal char); 
int insch(chtype char to insert); 


int insertln(void); 
int delch(void); 
int deletelní(void); 
int beep(void); 

int flash(void); 


curses 有 其 自己 的 字符 类 型 chtype， 它 可 能 比 标准 的 char 类 型 包含 
更 多 的 二 进 制 位 。 在 ncurses 的 标准 Linux 和 版 本 中 ，chtype 实 际 上 有 是 
unsigned long 类 型 的 一 个 typedef 类 型 定义 。 

add 系 列 函 数 在 光标 的 当前 位 置 添加 指定 的 字符 或 字符 串 。printw 
函数 采用 与 printf 函 数 相 同 的 方法 对 字符 串 进 行 格式 化 ， 然 后 将 其 添 加 


到 光标 的 当前 位 置 。refresh 函 数 的 作用 是 刷新 物理 屏幕 ， 成 功 时 返回 
OK， 发 生 错 误 时 返回 ERR。box 函 数 用 来 围绕 一 个 窗口 绘制 方 框 。 


在 标准 curses 函 数 库 中 ， 垂直 和 水 平 线 字符 可 能 只 能 使 用 普 
通 字 符 。 但 在 扩展 curses 画 数 库 中 ， 你 可 以 利用 两 个 定义 
ACS_VLINE 和 ACS_HLINE 来 分 别提 供 垂直 和 水 平 线 字符 ， 它 们 
可 以 让 你 绘制 更 好 看 的 方 框 ， 但 这 需要 终端 支持 这 些 画 线 字符 。 
一 般 这 个 功能 在 xterm 窗 口中 比 在 标准 控制 台中 工作 得 更 
好 ， 但 系统 对 该 功能 的 支持 往往 是 不 完整 的 ， 所 以 如 果 需 要 考虑 
程序 的 可 移植 性 ， 我 们 建议 最 好 不 要 在 程序 中 使 用 它们 。 


insch 函 数 捅 入 一 个 字符 ， 将 已 有 字符 同 右 移 ， 但 此 操作 对 行 尾 的 

影响 并 未 定义 ， 具 体 情 况 取 决 于 你 所 使 用 的 终端 。insertn 函 数 的 作用 

是 插入 一 个 空白 行 ， 将 现 有 行 依次 向 下 欧 一 行 。 两 个 delete 夯 数 的 作用 
与 上 述 两 个 insert 函 数 正 好 相反 。 

B co 你 可 以 调用 beep 函 数 。 但 因为 有 极 少 部 
分 终端 不 能 发 出 声 所 以 有 些 curses 设 置 会 在 JH t beep KZN LEBER 
内 烁 。 如 果 你 在 一 个 比较 繁忙 的 办 公 \ 宇 上 班 ， 蜂 鸣 就 可 能 产生 于 各 种 
机 器 设备 ， 这 时 ， 你 可 能 更 愿意 选择 屏幕 内 烁 这 种 方式 。 正 如 你 预期 
的 那样 ， 2 c qm 但 如 果 无 法 产生 闪烁 效 
果 ， 它 将 尝试 在 终端 上 发 出 声 


6.3.2 ”从 屏幕 读 取 


你 可 以 从 屏 笑 上 读 取 字 符 ， 虽 然 这 个 功能 并 不 利用， 因为 一 般 来 
说 ， 要 想 了 解 屏 途上 所 写 内 容 很 容易 。 但 如 琳 需 要 该 功能 ， 可 用 下 面 
这 些 函 数 实现 它 : 


#include <curses.h> 


chtype inch(void); 
int instr(char *string); 
int innstr(char *string, int number of characters); 


inch 画 数 总 是 可 用 有 的， 但 instr 和 innstr 范 数 并 不 总 被 支持 。inch 函 数 
返回 光标 当前 位 置 的 字符 及 其 属性 信息 。 注 意 ，inch 范 数 返 回 的 并 不 
是 一 个 字符 ， 而 是 一 个 chtype 类 型 的 变量 ， 而 instr 和 innstr 函 数 则 将 返 

回 内 容 写 到 字符 数组 中 。 


6.3.3 ”清除 屏幕 


消除 屏幕 上 的 某 个 区 域 主要 有 4 种 方法 ， 它 们 厦 : 


#include <curses.h> 


int erase(void); 
int clear (void); 
int clrtobot (void); 
int clrtoeol (void); 


erase KAE & Tee LBS LSA SH 9 clear K AH) Dy RER AA 
erase 函 数 ， 它 也 是 用 于 清 屏 ， 但 它 还 通过 在 内 部 调用 一 人 个展 层 函 数 
clearok 来 强制 重 现 屏幕 原文 。clearok 函 数 会 强制 执行 清 屏 操作 ， 并 在 
下 次 调用 refresh 函 数 时 重 现 屏幕 原文 。 

clear 函 数 通常 是 使 用 一 个 终端 命令 来 清除 整个 屏幕 ， 而 不 是 竹 试 
删除 当前 屏幕 上 每 个 非 空白 的 位 置 。 因 此 ，clear 函 数 是 一 种 可 以 彻底 
清除 屏幕 的 可 靠 方法 。 当 屏幕 显示 变 得 混乱 时 ，clear 函 数 和 refresh ER 
数 的 结合 提供 了 一 种 有 歼 的 重新 绘制 屏幕 的 手段 。 

clrtobot 函 数 清 除 当 前 光标 位 置 直 到 屏幕 结尾 的 所 有 内 容 。clrtoeol 
函数 清除 当前 光标 位 置 直到 光标 所 处 行 行 尾 的 所 有 内 容 。 


6.3.4 动 光标 
用 于 移动 光标 的 函数 只 有 1 个 ， 另 有 1 个 函数 用 来 控制 在 刷新 屏幕 
后 curses 将 光标 放置 的 位 置 : 


#include <curses.h> 


int move(int new_y, int new_x); 
int leaveok(WINDOW *window ptr, bool leave flag); 


move EA Zi Fd 3E Fo BR ERR ECEE SUE ERA » iE, BR REAL FR 
以 左上 角 (0,00 为 起 点 。 在 大 多 数 curses 版 本 中 ， 有 两 个 包含 物理 屏 
幕 尺寸 大 小 的 外 部 整数 LINES 和 COLUMNS， 它 们 可 用 于 决定 参数 
new_y 和 new_x 的 最 大 可 取 值 。 调 用 move 函 数 本 号 并 不 会 使 物理 光标 
移动 ， 它 仅 改变 逻辑 屏幕 上 的 光标 位 置 ， 下 次 的 输出 内 容 就 将 出 现在 
该 位 置 上 。 如 果 希 望 物理 屏幕 上 的 光标 位 置 在 调用 move 函 数 之 后 立刻 
有 变化 ， 就 需 在 它 之 后 立刻 调用 refresh 函 数 。 


leaveok K Z8 ix E — T Eum. VA HB fa Bl E BFE He 
curses 将 物理 光标 放置 的 位 置 。 默 认 情 况 下 ， 该 标志 为 false， 这 意味 着 
屏幕 刷新 后 ， 人 硬件 光标 将 停留 在 屏 间 上 逻辑 光标 所 处 的 位 置 。 如 果 该 
标志 被 设置 为 tue， 则 硬件 光标 会 被 随机 地 放置 在 屏幕 上 的 任意 位 
置 。 一 般 来 说 ， 默 认 选 项 更 符合 用 户 的 需求 ， 这 能 确保 光标 停留 在 一 
个 有 意义 的 位 置 。 


6.3.5 i 


每 个 curses 字 符 都 可 以 有 一 些 属性 用 于 控制 该 字符 在 屏幕 上 的 显示 
方式 ， 前 提 是 用 于 显示 的 硬件 设备 能 够 支持 要 求 的 属性 。 预 定义 的 属 
性 有 A_BLINK、A BOLD ` A DIM、A REVERSE、A_STANDOUT 
和 A_UNDERLINE。 你 可 以 用 下 面 这 些 函 数 来 设置 单个 属性 或 同时 设 
置 多 个 属性 : 


#include <curses.h> 


int attron(chtype attribute); 
int attroff(chtype attribute); 
int attrset(chtype attribute); 
int standout(void); 

int standend(void); 


attrset 范 数 设 置 curses 属 性 ，attron 和 和 attroff 函 数 在 不 影响 其 他 属性 

的 前 提 下 启用 或 关闭 指定 的 属性 。standout 和 standend 范 数 提 供 了 一 种 

J 的 强调 或 “突出 * 模 式 ， 在 大 多 数 终端 上 ， 它 通常 被 映射 为 反 
M/s ? 


X 验 移动 、 插 入 和 属性 

现在 ， 你 已 掌握 了 许多 管理 屏幕 的 方法 ， 下 面 可 以 尝试 编 写 一 个 
更 复杂 的 例子 moveadd.c 了。 你 将 在 程序 中 包含 多 个 对 refresh 和 sleep 范 
数 的 调用 ， 以 便 了 解 在 程序 执行 的 每 个 阶段 屏幕 的 显示 情况 。 一 般 情 
况 下 ，curses 程 序 会 尽 可 能 少 地 刷新 屏幕 ， 因 为 这 并 不 是 一 种 很 有 效 的 
控 作 。 这 里 的 代码 主要 是 方便 演示 。 

(1) 在 程序 的 开始 包含 一 些 必 要 的 头 文件 ， 定 义 几 个 字符 数组 和 

一 个 指向 这 些 数组 的 指针 ， 然 后 对 curses 结 构 进 行 初 始 化 : 


include <stdio.h> 

finclude <unistd.h> 
tinclude «stdlib.h» 
finclude <string.h> 
include «curses.h» 


int main) 

( 
const char vitch one[] = * First Witch “上 
coust char witch.two[] = * Second Witch ": 
const char *scan ptr: 


initscril: 


(2) 现在 是 最 初 要 显示 的 3 组 文本 ， 它 们 会 以 1 秒 为 间隔 依次 显 
在 屏 攻 上。 请 注意 对 文本 属性 标志 的 开关 : 


move(5, 15); 

attroni(A BOLD) > 
printwi*te*, "Macbeth*): 
attrzotf (A_BOLD) : 
refreshi); 


Sleep(1); 


move(8, 15}; 

attron(A, STANDOUT| ; 

printw|'ts', “Thunder and Lightning*); 
attroff (A, STANDOUT) ; 

refresh(); 

sleep(l); 


move(l0, 10); 

printw("¢s*, “When shall we three meet again"); 
move(il, 23); 

printwi*ts*, “In thunder, lightning, or in rain ?"); 
move(13, 10); 

printw|**^s*, "When the hurlyburly's done,"]: 
move(14,23); 

printwi*te*, “When the battle's lost and won.*); 
refresh(!: 

sleepí1): 


(3) 确定 演员 并 将 他 们 的 名 字 以 一 次 一 个 字符 的 方式 插入 到 指定 


的 位 置 : 
attron(A_DIM); 
scan_ptr = witch_one + strlen(witch_one) - 1; 
while(scan_ptr != witch_one) { 
move (10,10); 
insch(*scan ptr--); 
) 
scan ptr = witch two + strlen(witch two) - 1; 
while (scan ptr != witch two) ( 
move(13, 10); 
insch(*scan, ptr--); 
) 
attroff(A DIM); 
refresh(); 
sleep(1); 


(4) 最 后 ， 将 光标 移动 到 屏幕 的 右 下 角 ， 然 后 结束 程序 ; 
move(LINES - 1, COLS - 1); 


refresh(); 
sleep(1); 


endwin() ; 
exit (EXIT_SUCCESS) ; 


当 运 行 这 个 程序 时 ， 最 终 的 屏幕 如 图 6-3 所 示 。 

糟糕 的 是 ， 这 里 的 屏幕 截图 并 未 很 好 地 表现 出 屏幕 完整 的 效果 ， 
它 也 未 能 显示 出 光标 的 位 置 ， 光 标的 位 置 应 该 在 屏幕 的 右 下 角 。 

你 可 能 会 发 现 ， 与 标准 控制 台 相 比 ，xterm 能 更 加 准确 、 可 靠 地 显 
示 curses 程 序 的 输出 效果 。 


rickSlocalhost:—/bipse/chod 
Bic Edt Yew Terminal Tabs Help 


First Witch when shall we three seat again 
In thunder, Lightning, or in rain 


Second Witch When thc hurlyburly's donc, 
When the battle's lost and won. 


实验 解析 

在 初始 化 一 些 变量 和 curses 屏 幕 之 后 ， 使 用 move 函 数 在 屏幕 上 移 
动 光标 。 通 过 attron 和 attroff 函 数 来 控制 显示 在 屏幕 上 指定 位 置 的 文本 
的 属性 。 然 后 ， 程 序 使 用 insch 函 数 来 演示 如 何 揪 入 字符 。 最 后 ， 程 序 
关闭 curses 函 数 库 并 结束 。 


6.4 


curses 函 数 库 不 仅 提供 了 控制 屏幕 显示 的 易 用 接口 ， 还 提供 了 控制 
键盘 的 简单 方法 。 


6.41 ”键盘 模式 


键盘 读 取 例 程 由 键盘 模式 控制 。 用 于 设置 键盘 模式 的 国 数 有 : 


#include <curses.h> 


int echo(void); 

int noecho (void); 
int cbreak (void); 
int nocbreak (void); 
int raw(void); 

int noraw(void); 


两 个 echo 函 数 用 于 开局 或 关闭 输入 字符 的 回 显 功能 。 其 余 4 个 函数 
调用 用 于 控制 在 终端 上 输入 的 字符 传送 给 curses 程 序 的 方式 。 

为 解释 清楚 cbreak 芳 数 的 作用 ， 你 需要 首先 理解 何 为 默认 输入 模 
式 。 当 curses 程 序 通过 调用 initscr 函 数 开 始 运行 时 ， 输 入 模式 被 设置 为 
预 处 理 模式 (或 称 为 cooked 模 式 ) 。 这 意味 着 所 有 处 理 都 是 基于 行 
Hy, Hite, RAGA PRESB ZI, MAW BETS RK 
给 程序 。 在 这 种 模式 下 ， 键 盘 特 殊 字 符 被 启用， 所 以 按 下 合适 的 组 合 
键 即 可 在 程序 中 产生 一 个 信号 ， 如 采 是 通过 串 行 口 或 调制 解 调 器 等 连 
接 终 端 ， 则 流 控 也 处 于 启用 状态 。 程 序 可 通过 调用 cbreak 函 数 将 输入 
模式 设置 为 cbreak 模 式 ， 在 这 种 模式 下 ， 字 符 一 经 键入 束 补 立刻 传递 
给 程序 ， 而 不 像 在 cooked 模 式 中 那样 首先 缓存 字符 ， 直 到 用 户 按 下 回 
车 键 后 才 将 用 户 输 入 的 字符 传递 给 程序 。cbreak 模 式 与 cooked 模 式 一 
样 ， 键 盘 特 殊 字 符 也 被 局 用 ， 但 一 些 简 单 的 特殊 字符 ， 如 退 格 键 
Backspace 会 被 直接 传递 给 程序 处 理 ， 所 以 如 果 想 让 退 格 键 保留 原来 的 
功能 ， 你 就 必须 目 己 在 程序 中 实现 它 。 

raw 芳 数 调 用 的 作用 是 关闭 特殊 字符 的 处 理 ， 所 以 执行 该 男 数 调用 
后 ， 再 想 通 过 输入 特殊 字符 序列 来 产生 信和 号 或 进行 流 控 承 不 可 能 了 。 
nocbreak 函 数 调用 将 输入 模式 重新 设置 为 cooked 模 式 ， 但 特殊 字符 的 


oo o noraw 函 数 调用 同时 恢复 cooked 模 式 和 特殊 字符 处 
理 功 能 。 


6.4.2 ”键盘 输入 


读 取 键盘 输入 非常 简单 ， 主 要 的 函数 有 : 


#include <curses.h> 


int getch(void) ; 

int getstr(char *string); 

int getnstr(char *string, int number_of characters); 
int scanw(char *format, ...); 


这 些 函 数 的 行为 与 它们 的 非 curses 版 本 getchar、gets 和 scanf 非 常 相 
似 。 要 注意 的 是 ，getstr 函 数 对 其 返回 的 字符 串 的 长 度 没 有 限制 ， 所 以 
使 用 这 个 函数 时 要 非常 小 心 。 如 果 所 使 用 的 curses 版 本 文 持 getnstr 函 数 
〈( 它 可 以 对 读 取 的 字符 数目 加 以 限制 ) ， 你 束 应 该 尽 可 能 地 用 它 来 奉 
代 getstr 函 数 。 这 与 你 在 第 3 章 中 看 到 的 gets 和 fgets 函 数 非 常 类 似 。 
下 面 是 一 个 短小 的 示例 程序 ipmode.c， 它 演示 了 如 何 处 理 键 盘 。 


X 验 ”键盘 模式 和 输入 
(1) 首先 ， 设 置 程序 并 执行 初始 化 curses 画 数 库 的 调用 ， 


' "lude mistd.h» 


olut atdllb.h» 
' lude «curses.h» 
fginclude «string.h» 


(2) 用 户 输入 密码 时 ， 你 不 能 让 密码 回 显 在 屏幕 上 。 然 后， 检查 
用 户 输 入 的 密码 是 否 等 于 xyzzy: 


" (3) BUS, SUB SEEDS. H h ARUDI AUD fes 


实验 解析 

关闭 键 盘 输 入 回 显 并 将 输入 模式 设置 为 cbreak 后 ， 你 设置 一 块 内 
存 区 域 用 于 接收 用 户 和 输入 的 密码 。 每 个 输入 的 密码 字符 被 立即 处 理 并 
在 屏 医 的 下 一 个 位 置 上 显示 一 个 * 号 。 你 需要 在 每 次 输出 * 扣 后 刷 狐 屏 
， 用 stmcmp 男 数 来 比较 用 户 输 入 的 密码 和 你 存在 程序 中 的 正 


如 果 使 用 的 curses 函 数 库 版 本 很 老 ， 你 可 能 需要 在 getstr 函 数 
调用 之 前 加 上 一 个 refresh 函 数 调用 。 在 ncurses 版 本 中 ，getstr 函 数 
调用 会 目 动 刷新 屏幕 。 


6.5 H 


到 目前 为 止 ， 你 一 直 将 终端 用 作为 一 个 全 屏幕 的 输出 介质 。 对 短 
小 、 人 简单 的 程序 来 说 ， 这 样 做 一 般 已 足够 了 ， 但 curses 范 数 库 的 功能 远 
不 止 如 此 。 你 可 以 用 curses 范 数 库 在 物理 屏幕 上 同时 显示 多 个 不 同 尺寸 
的 窗口 。 本 方 中 介绍 的 许多 函数 只 被 X/Open 规 范 定义 的 扩展 curses 函 
数 库 支持 ， 但 因为 ncurses 琅 数 库 也 支持 它们 ， 所 以 在 大 多 数 平台 中 使 
用 它们 并 不 会 出 现 问 题 。 现 在 是 时 候 开 始 学 习 多 窗口 的 使 用 方法 了 。 
并 应 用 到 多 窗口 的 情况 


65.1 WINDOW 结 


虽然 前 面 已 介绍 过 标准 屏幕 stdscr， 但 目前 为 止 ， 你 几乎 没有 使 用 
它 的 必要 。 因 为 ， 儿 乎 所 有 我 们 前 面 讨 论 过 的 函数 都 假设 它们 工作 在 
stdscr 之 上 ， 因 此 ，stdscr 无 需 作 为 一 个 参数 传递 给 这 些 函 数 。 

标准 屏幕 stdscr 只 是 WINDOW 结 构 的 一 个 特例 ， 就 像 标 准 输 出 
stdout 是 文件 流 的 一 个 特例 一 样 。WINDOW 结 构 通常 定义 在 头 文件 
curses.h 中 ， 虽 然 研究 该 结构 是 有 意义 的 ， 但 程序 应 该 永远 都 不 要 直接 
访问 它 ， 因 为 该 结构 在 不 同 的 curses 版 本 中 的 实现 方式 不 同 。 

你 可 以 用 函数 调用 newwin 和 delwin 来 创建 和 销毁 窗口 : 


finclude «curses.h 


WINDOW *nowwin(int num of lines, ínt num of cols, int start y, int start x); 
int delwin(WINDOW *window to delete); 


newwin EK Zi B*) E Fd z& Gi & — ^P 39r 4 L1, V ELI A, RRMA 
(start y, start x) 开始 ， 行 数 和 列 数 分 别 由 参数 num_of lines 和 
num_of_cols 指 定 。 它 返回 一 个 指 问 新 窗口 的 指针 ， 如 果 新 窗口 创建 失 
败 则 返回 null。 如 果 想 让 新 窗口 的 右 下 角 正 好 落 在 屏幕 的 右 下 角 上 ， 
你 可 以 将 该 本 数 的 行 、 列 参数 设 为 0。 所 有 的 窗口 范围 都 必须 在 当前 屏 
幕 苑 围 之 内 ， 如 果 新 窗口 的 任何 部 分 落 在 当前 屏幕 范围 之 外 ， 则 
newwin 函 数 调 用 将 失败 。 通 过 newwin 函 数 创 建 的 新 窗口 完全 独立 于 所 
有 已 存在 的 窗口 。 默 认 情 况 下 ， 它 被 放置 在 任何 已 有 窗口 之 上 ， 禾 六 
(但 不 是 改变 ) 它们 的 内 容 。 
delwin 芳 数 的 作用 是 删除 一 个 先前 通过 newwin 函 数 创 建 的 窗口 。 
因为 调用 newwin 函 数 可 能 会 给 新 窗口 分 配 内 存 ， 所 以 当 不 再 需要 这 些 


窗口 和 时， 不 要 起 记 通过 delwin 函 数 将 其 删除 。 


注意 ， 千 万 不 要 尝试 删除 curses 自 己 的 窗口 stdscr 和 curscr! 


创建 新 窗口 后 ， 怎 样 才能 对 它们 进行 写 操作 呢 ? 管 案 是 ， 几 乎 所 
有 你 已 见 过 的 画 数 都 有 对 应 特定 窗口 进行 操作 的 通用 版 本 ， 并 是 为 方 
便 用 户 的 使 用 ， 它 们 还 都 具备 光标 移动 的 功能 。 


6.5.2 JÉ 


A ES fS FH E EN Rue ere EUM 这 两 个 函数 ， 
包括 其 他 一 些 函 数 ， 都 可 以 通过 加 上 一 些 前 组 变 为 通用 函数 。 前 缀 w 
用 于 窗口 、mv 用 于 光标 移动 、mvw 用 于 在 窗口 中 移动 光标 。 如 果 查 看 
大 多 数 curses 函 数 库 实 现 中 的 curses 头 文件 ， 你 会 发 现 你 所 使 用 过 的 许 
多 函数 都 只 是 调用 这 些 通用 函数 的 简单 的 宏 定义 (#define 语 句 ) 。 

如 果 给 函数 增加 了 w 前 级， 就 人 须 在 该 芳 数 的 参数 表 的 最 前 面 增 
加 一 个 WINDOW 指 针 参 数 。 ATLAS EROR TÉ emv BUR 则 需要 在 
函数 的 参数 表 的 最 前 面 增加 两 个 参数 ， 分 别 是 纵 坐 标 y 和 横 坐 标 x， 这 
两 个 坐标 值 指定 了 执行 操作 的 位 置 。 LU is A RARE BILL 
相对 于 屏幕 的 ， 坐 标 (0,0) 代表 窗口 的 左上 角 。 

如 采 给 台面 数 增加 了 mvw 前 弘 ， 就 需要 多 传递 3 个 参数 ， 它 们 分 别 是 
一 个 WINDOW 指 针 、y 和 x 坐标 值 。 让 人 困惑 的 是 ，WINDOWS 指 针 参 
数 总 是 出 现在 屏幕 坐标 值 之 前 、 虽然 从 前 组 的 写法 来 看 ，y 和 xX 参 数 应 
是 首 移出 现 的 。 

作为 一 个 例子 ， 下 面 列 出 了 函数 addch 和 printw 的 所 有 原型 定 


AN: 


finclude <curses.h> 


int addch(const chtype char); 

int waddch(WINDOW "window pointer, const chtype char) 

int mvaddch(int y, int x, const chtype char); 

int mvwaddch(WINDOW *window pointer, int y, int x, const chtype char); 


int printw(char *format, ...); 

int wprintw(WINDOW *window pointer, char Kris — E 

int mvprintw(int y, int x, char *format, ...); 

int mvwprintw(WINDOW *window pointer, int y, int x, char *format, ...];j 


其 他 许多 函数 ， 例 如 inch， 也 有 加 上 诸如 mv 和 w 前 缕 的 通 FA ER 


MA 
o 
p 


6.5.3 ^ O 
iI P AEKA, PRAT DM oA EDA l fO: 


#include <curses.h> 


int mvwin(WINDOW *window to move, int new y, int new x); 
int wrefresh(WINDOW *window ptr); 

int wclear(WINDOW *window ptr); 

int werase(WINDOW *window ptr); 

int touchwin(WINDOW *window ptr); 

int scrollok(WINDOW *window ptr, bool scroll flag); 

int scroll(WINDOW *window ptr); 


mvwin 函 数 的 作用 是 在 屏幕 上 移动 一 个 窗口 。 因 为 不 允许 窗口 的 
任何 部 分 超出 屏幕 范围 ， 所 以 如 果 在 调用 mvwin 函 数 时 ， 将 窗口 的 某 
个 部 分 移动 到 屏幕 区 域 之 外 ，mvwin 函 数 调 用 将 会 失败 。 

wrefresh ` wclear?llwerases Ek 23547 9] 3: Hil [8] 41 Za Jrefresh ^ clear 
erases EA ZA HY I FB buds » ET) ARS S—SWINDOWS ETE RL, Mt 
可 针对 特定 的 窗口 进行 操作 ， 而 不 仅仅 局 限于 stdscr ° 

touchwin 函 数 非常 特殊 ， 它 的 作用 是 通知 curses 函 数 库 其 指针 参数 
指向 的 窗口 内 容 已 发 生 改 变 。 这 就 意味 着 ， 在 下 次 调用 wrefresh 范 数 
时 ，curses 必 须 重 新 绘制 该 窗口 ， 即 使 用 户 实 际 上 并 未 修改 该 窗口 中 的 
。 当 屏幕 上 重 琶 着 多 个 窗口 时 ， 你 可 以 通过 该 函数 来 安排 要 显示 

和 窗口。 

两 个 scrol 函 数控 制 窗 口 的 卷 屏 。 如 果 传 递 给 scrollok 函 数 的 是 布尔 
值 true 〈 通 常 是 非 零 值 ) ， 则 允许 窗口 卷 屏 。 而 默认 情况 下 ， 窗 口 是 
AN BE 78 BRAY © scroll 函数 的 作用 只 是 把 窗口 内 容 上 卷 一 行 。 一 些 curses 
函数 库 的 实现 版 本 中 还 有 函数 wsctL， 它 有 一 个 指定 卷 行 行 数 的 参数 ， 

e 我们 将 在 本 章 的 稍 后 部 分 再 次 讨论 卷 
GE [RIAL o 


x 验 管理 多 窗口 

现在 ， 你 已 知道 如 何 管理 多 个 窗口 了 ， 接 下 来 ， 你 可 以 把 刚 学 到 
eee ° 为 简洁 起 见 ， 在 程序 中 忽略 了 
HIRE ° 


(1) 与 往常 一 样 ， 我 们 先 安排 好 各 种 定义 : 


a 然后 ， 用 子 符 填充 基本 窗口 ， 填 充 完 逻 辑 屏 幕后 号 开始 刷新 


(3) 现在 ,创建 一 个 尺寸 为 10x20 的 新 窗口 ， 为 它 添加 一 些 文 
本 ， 然 后 将 该 窗口 绘制 到 屏幕 上 : 


(4) 接 下 来 ， 对 背景 窗口 中 的 内 容 做 些 修改 。 当 再 次 刷新 屏幕 
hl, new window. ptrfRIu HJ f LUREBSOR ss f: 


(5) 此 时 ， 如 果 调 用 wrefresh 来 刷新 新 窗口 ， 则 什么 也 不 会 发 
生 ， 因 为 你 并 未 对 新 窗口 做 过 改动 : 


(6) 但 如 果 先 对 新 窗口 调用 一 次 touchwin 函 数 ， 让 curses 


误 以 为 


新 窗口 中 的 内 容 已 发 生变 化 ， 则 下 一 个 wrefresh 函 数 调 用 将 再 次 把 新 寄 


口 


ms 


3585] Re A e B TA : 


touchwininew window ptr); 
wrefresh (new window ptr]; 
z1eep(2) ; 


(7) RRR, BMA MME Be BO 


popup window ptr « newwin(10, 20, &. B: 
box(popop window ptr. '|', '-') 
mvwprintwipopup window ptr. 5, 
wrefreshipopup. window ptr): 
sleep(2); 


2, **4*, *Pop Up Window!* 


(8) 然后 ， 在 清 屏 和 删除 这 两 个 新 窗口 之 前 在 屏幕 上 轮流 显示 


fi]: 


rouchwininew, window pcr]; 
wrefrenhinew window ptr); 
21eep(2] : 

wclear[new window ptr) | 
wrefresahinew window ptr): 
sleep(2); 

delwin (new window ptr); 
touchwin [popup window ptr): 
wrefresh (popup window ptr); 
sleepi2) 
delwinipopup window ptr]; 
touchwin[stdüscr]: 
zefrosni! 

sleepi?); 

endwin(]: 

exit|EXTIT SUCCESS! ; 


遗憾 的 是 ， 我 们 无 法 让 读者 在 书 中 看 到 这 


显示 了 绘制 第 一 个 弹出 窗口 后 的 屏幕 截图 。 


rick localhost: ~/bipse/ thos 
file Edit View Terminal Tabs Help 


一 切 发 生 的 过 程 。 图 6-4 


6123456789012345678901234567890123456789012315628901234567898123156789 
12345678991234567890123456769012345578901231567890122156789091234567890 
2315678901234567890123156789012345678901234567890123456789012315678981 
3456789012345678901234567890123456739012345678901234567690123456789012 
4567890123456789212345678901234567890123456739012345673901234567890123 


56789 
67890 
78991 Hello World 
89012 
96123 


012345678901234567890123456789012345678901234 
123456709912345678991214567890123456789012345 
234567890123456789012345673991234567890123456 
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4567896123456 7890 12 345678968) 234567890123456)8 


01234 Notice how very (05678991234567890 1234567R9012345678901 27456789 
12445n9 Lines wrap ins iden 8901243455 /89012 3456 /69B8 12 5456/8901 24450090 


2345 the window 
3455/7 
4^*h IN 


1890123456 759817 3456 /490] 7 4456/8901 7 $455 / B8 1 
898174456 759817 34 5h / 8901 7 34*h 7/898 1 7 4450 /H3817 
9812 34*5h /H981 2 445^ /H981 7 145h 490 1 7 445b /W£9812 € 


Sh /K9817345h /83017 445b TE) 7 3455 /WRT 7 3456 ROL? 4S6 THIN]D 7 TAS TERT 7 44 
67296123435753012345678901234565785381234567898 | 23456789912 3455 7A 9812 14* 
789381234567838123456789301234*5^7890123456789012 34557898 12 3456 283012 3456 
8901234567890123450678981234507890123430783012345067890123436789381234567 
90123456789812345678981234567890123456789017345067890123436789012345678 
8123456789812345678901234567890123450763012343678901234507890123426783 


Al 6-4 


在 改变 背景 窗口 后 ， 在 屏幕 上 又 绘制 了 一 个 弹出 窗口 ， 这 时 屏幕 
的 显示 如 图 6-5。 

实验 解析 

TEE A Oat Ze, Be eA Ae Rae, DAE H 
户 看 到 添加 在 其 上 的 新 curses 窗 口 。 然 后 ， 程 序 演示 了 如 何在 背景 之 上 
添加 一 个 新 窗口 ， 以 及 新 窗口 中 文本 的 折 行 效 末 。 你 还 看 到 了 如 何 使 
用 touchwin 来 强制 curses 重 新 绘制 窗口 ， 即 使 窗口 内 容 未 发 生 任 何 改 


rickZlocathost:~/bipse/cho6 
Fite Edit View Terminal Tabs Help 
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| 8961 23456789812345678981234567898) 23456789 
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[0123455 1898125456 /898 123456 7898172456 / B98) 

[1234557893817 4450/8901) 3450/8698 174456 7/89817 

| | 23455 7898173496 /H98 12 1455 7898179456 7/898174 

5h 78981 /| | 44907898 12 4496 7898124496 / E9617 14^h /W48 1734 
^7898121 | | 4367IR90123456789817345678981734567R9617345 
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901234567890 12345678696 123456789012345678901234567890123456789012345678 
0123456789812345078901234567898123456769612345678981234567896123456769 


接着 ， 程 序 添加 了 第 二 个 窗口 ， 该 窗口 履 盖 了 第 一 个 窗口 的 内 
容 ， 这 演示 了 curses 是 如 何 管理 重 登 窗口 的 。 最 后 ， 程 序 关 闭 curses 函 

从 上 面 的 示例 代码 中 可 以 看 出 ， 为 了 让 窗口 在 屏幕 上 以 正确 的 顺 
序 显 示 ， 你 必须 在 刷新 窗口 时 非常 小 心 。 因 为 curses 芳 数 库 并 不 存储 关 
于 窗口 之 间 层 次 关系 的 任何 信息 ， 所 以 如 果 要 求 curses 刷 新 多 个 寄 口 
你 必须 自己 管理 窗口 之 间 的 层次 关系 。 


为 确保 curses 能 够 以 正确 的 顺序 绘制 窗口 ， 你 必须 以 正确 的 
顺序 对 它们 进行 刷新 。 其 中 一 个 办 法 就 是 ， 将 所 有 窗口 的 指针 存 
储 到 一 个 数组 或 列表 中 ， 你 通过 这 个 数组 或 列表 来 维护 它们 应 该 
显示 在 屏幕 上 的 顺序 。 


6.5.4 T, | 


从 上 一 节 的 例子 中 可 以 看 出 ， 对 多 个 窗口 进行 刷新 需要 一 定 的 技 
巧 ， 但 还 不 至 于 太太 烦 。 但 当 要 更 新 的 终端 是 通过 慢 速 链 路 连接 到 主 
机 时 ， 这 个 潜在 的 问题 就 会 变 得 非常 严重 。 滁 运 的 是 ， 现 在 这 种 情况 
已 经 很 少见 了 ， 但 实际 上 处 理 这 个 问题 非常 简单 ， 所 以 ， 为 了 内 容 的 
完整 性 ， 我 们 在 这 里 介绍 这 个 问题 的 解决 方法 。 

我 们 的 目标 是 尽量 减少 需要 在 屏幕 上 绘制 的 字符 数目 ， 因 为 在 慢 
速 链 路 上 ， 屏 幕 绘制 的 速度 可 能 会 慢 得 让 人 难以 忍受 。curses 函 数 库 为 
此 提供 了 一 种 特殊 手段 ， 这 需要 用 到 下 面 两 个 函数 : wnoutrefresh 和 
doupdate: 


#include <curses.h> 


int wnoutrefresh(WINDOW *window_ptr); 
int doupdate(void); 


wnoutrefresh EJ Zi Fd T V XE Fe ee E AIK aI RHEL, (HEF ARES 
TE HY A AIK HEE TF, EXRIEEEOGWDAGXASUZEYmWH LÍTEEIdoupdateER BLK 
SE B, o WSR e S] wnoutrefreshiK žit, ZA Ja 37 ZI VA] Hi doupdate ER ži, 
则 它 的 效果 与 直接 调用 wrefresh 完 全 一 样 。 但 如 果 想 重新 绘制 多 个 窗 
口 ， 你 可 以 为 每 个 窗口 分 别 调用 wnoutrefresh 函 数 (当然 要 按 正 确 的 顺 
序 来 操作 ) ， 然 后 只 需 在 调用 最 后 一 个 wnoutrefresh 之 后 调用 一 次 
doupdate 函 数 即 可 。 这 人 允许 curses 依 次 为 每 个 衫 口 执行 屏幕 更 狐 计 算 工 
作 ， 最 后 仅 把 最 终 的 更 新 结果 输出 到 屏幕 上 。 这 种 做 法 可 以 最 大 限度 
地 减少 curses 需 要 发 送 的 字符 数目 。 


6.6 O 


介绍 完 多 窗口 后 ， 我 们 来 看 一 种 多 窗口 的 特例 ， 子 窗口 。 子 窗口 
的 创建 和 删除 可 以 用 以 下 几 个 画 数 来 完成 : 


int start y, int start x); 
int delwin(WINDOW *window to delete); 


subwinEN ZEB AU LF 5 newwinlgZsEAE— FE, EO ERE 
程 也 和 其 他 窗口 一 样 ， 都 是 通过 调用 delwin 函 数 来 完成 。 如 同 对 等 新 
窗口 一 样 ， 你 可 以 使 用 以 mvw 为 前 组 的 函数 来 写 子 窗口 。 事 实 上， 在 
大 多 数 情 况 下 ， 子 窗口 的 行为 与 新 窗口 非常 相似 ， 两 者 之 间 只 有 一 个 
重要 的 区 别 : 子 窗口 没有 自己 独立 的 屏幕 字符 存储 空间 ， 它 们 与 其 父 
窗口 (在 创建 子 窗口 时 指定 ) 共享 同一 字符 存储 空间 。 这 意味 着 ， 对 
子 窗 口中 内 容 的 任何 修改 都 会 有 反映 到 其 父 窗 口中 ， 所 以 删除 子 窗 口 
时 ， 屏 幕 显示 不 会 发 生 任何 变化 。 

乍 看 起 来 ， 子 窗口 好 像 没 有 用 处 。 为 何不 直接 在 父 窗口 中 修改 
UE? 子 和 窗口 最 主要 的 用 途 是 ， 提 供 了 一 种 简洁 的 方式 来 卷 动 另 一 窗口 
里 的 部 分 内 容 。 在 编写 curses 程 序 时 ， 我 们 经 常会 需要 卷 动 屏幕 的 某 个 
小 区 域 。 通 过 将 这 个 小 区 域 定义 为 一 个 子 窗口 ， 然 后 对 其 进行 卷 动 ， 
就 能 达到 我 们 想 要 的 效果 。 


使 用 子 窗 口 有 个 强加 的 限制 :在 应 用 程序 刷新 屏幕 之 前 必须 
先 对 其 父 窗 口 调用 touchwin 函 数 。 


S 验 子 窗口 

现在 你 已 看 到 了 这 些 新 函数 ， 下 面 这 个 简短 的 例子 将 显示 它们 是 
如 何 工作 的 ， 以 及 它们 与 完 前 使 用 的 窗口 钞 数 有 何不 同 。 

(1) 首先 是 subscl.c 的 初始 化 代码 部 分 ， 它 用 一 些 文本 初始 化 基 
本 窗口 的 显示 : 


(2) 现在 创建 一 个 新 的 卷 动 子 窗口 。 根 据 前 面 的 建议 ， 必 须 在 刷 
39r BERE ZZ BIDS] AC ERE VS FR teuchwin ER ZA: 


(3) 接 下 来 ， 删 除 子 窗口 中 的 内 容 ， 重 新 输出 一 些 文字 ， 然 后 刷 
新 它 。 深 动 文本 是 通过 loop 循 环 来 实现 的 : 


(4) 循环 结束 后 ， 删 除 子 窗口 ， 然 后 再 次 刷新 基本 屏幕 : 


图 6-6 古 程序 执行 结束 后 ， 你 看 到 的 屏幕 显 示 情 况 。 
实验 解析 


在 安排 指针 sub_window_ptr 指 向 subwin 函 数 调用 的 结果 后 ， 把 

窗口 设置 为 可 卷 动 。 即 使 在 删除 了 子 实 口 和 重新 刷新 了 基本 窗 

(stdscr) 之 后 ， 屏 幕 上 的 文本 依然 保持 原来 的 样子 ， 这 是 因为 子 窗 
实际 更 新 的 是 stdscr 中 的 字符 数据 。 


X 
O 
O 


rick Zlocalhost:~/bipge/cho6b 
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图 6-6 


6.7__keypad#ax\, 


你 已 看 到 curses 提 供 的 一 些 用 于 处 理 键盘 的 功能 。 一 般 键 盘 至 少 都 
会 包 售 方 回 键 和 功能 键 ， 许 多 键盘 还 市 有 数字 小 键盘 以 及 诸如 Insert、 
Home 等 其 他 按键 。 

对 于 大 多 数 终端 来 说 ， 解 码 这 些 按键 是 一 件 很 困难 的 事 ， 因 为 它 
们 往往 会 发 送 以 escape 字 符 开 头 的 字符 串 序 列 。 应 用 程序 不 仅 要 区 
分 “单独 按 下 Escape 键 > 和 “ 按 下 某 个 功能 键 而 生成 的 以 Escape 字 符 开 头 
的 字符 串 序 列 ”， 还 必须 处 理 不 同 的 终端 对 于 同一 逻辑 按键 使 用 不 同 字 
符 串 序列 的 情况 。 

对 运 的 是 ，curses 函 数 库 提 供 了 一 个 精巧 的 用 于 管理 功能 键 的 功 
能 。 对 每 个 终端 来 说 ， 它 的 每 个 功能 键 所 对 应 的 转 义 序列 都 被 保存 ， 
通 背 是 保存 在 一 个 terminfo 结 构 中 ， 而 头 文件 curses . h 通 过 一 组 以 
KEY 为 前 绥 的 定义 来 管理 逻辑 键 。 

curses 在 局 动 时 会 关闭 转 义 序列 与 逻辑 键 之 间 的 转换 功能 ， 该 功能 
ee ° 该 函数 调用 成 功 时 ， 返 回 OK， 否 则 
就 返回 ERR ° 


#include <curses.h> 


int keypad(WINDOW *window_ptr, bool keypad_on); 


将 keypad_on 参 数 设置 为 tue， 然 后 调用 keypad 函 数 来 局 用 keypad 
模式 。 在 该 模式 中 ，curses 将 接管 按键 转 义 序列 的 处 理工 作 ， 读 键 一 操 
作 不 仅 能 够 返回 用 户 按 下 的 键 ， 还 将 返回 与 逻辑 按键 对 应 的 KEY _ 定 
x. o 


使 用 keypad 模 式 有 下 面 3 个 小 小 的 限制 。 

O “识别 escape 转 义 序 列 的 过 程 是 与 时 间 相 关 的 。 许 多 网 络 协议 会 
将 字符 组 合成 数据 包 (这 将 导致 escape 转 义 序列 的 识别 不 准 
H) ， 或 者 是 将 字符 串 分 割 开 〈 这 将 导致 功能 键 的 转 义 序列 有 可 
能 被 识别 为 一 个 单独 的 Escape 按 键 和 其 他 独立 的 字符 串 ) 。 这 种 
情况 在 广域网 和 其 他 慢 速 链 路 上 将 更 为 严重 。 这 一 问题 的 唯一 解 
决 方法 是 设法 对 终端 进行 编程 ， 让 它 针 对 用 户 和 希望 使 用 的 每 个 功 
能 键 只 发 送 一 个 单独 的 、 唯 一 的 字符 ， 虽 然 这 将 限制 可 使 用 的 控 
制 字 符 的 数目 。 


O 为 了 让 curses 能 够 区 分 “单独 按 下 Escape 键 "和 “一 个 以 Escape 字 
符 开 头 的 键盘 转 义 序列 ”， 它 必须 等 待 一 人 小段 时 间 。 有 时 候 ， 在 局 
用 了 keypad 模 式 后 ， 处 理 Escape 按 键 所 造成 的 非常 细微 的 延 时 都 
可 能 会 被 注意 到 。 

口 “curses 不 能 处 理 二 义 性 的 escape 转 义 序 列 。 如 果 终 端 上 两 个 不 
同 的 按键 会 产生 完全 相同 的 转 义 序列 ，curses 将 不 会 处 理 这 个 转 义 
序列 ， 因 为 它 不 知道 该 返回 哪个 逻辑 按键 。 


实 验 使 用 keypad 模 式 
下 面 这 个 小 程序 keypad.c 演 示 了 keypad 模 式 的 使 用 方法 。 当 运行 这 
个 程序 时 ， 按 下 Esc 按键 并 注意 观察 细微 的 延 时 。 程 序 将 在 这 段 延 时 里 
判断 这 个 Esc 是 一 个 escape 转 义 序列 的 开头 还 是 一 个 单独 的 按键 : 
(1) 首先 对 程序 和 curses 范 数 库 进行 初始 化 ， 然 后 启用 keypad 模 


A 


(2) 接 下 来 ， 关 闭 回 显 功 能 以 防止 光标 在 你 按 下 方向 键 时 发 生 移 
动 。 然 后 清 屏 并 显示 一 些 文 本 。 程 序 将 等 竺 用 户 的 击 键 动作 ， 除 非 用 
户 的 按键 是 字母 Q 或 发 生 了 错误 ， 否 则 按键 所 对 应 的 字符 将 显示 在 屏 
就 把 这 个 转 义 序列 显示 
EFL: 


end 


实验 解析 

在 局 用 keypad 模 式 之 后 ， 你 看 到 了 该 模式 是 如 何 识别 键 一 上 的 各 
种 其 他 按键 的 ， 这 些 按键 都 将 生成 escape 转 义 序 列 。 你 还 将 注意 到 
Escape 键 的 检测 要 略 慢 于 其 他 按键 。 


彩色 显 MIA 不 


以 前 ， 只 有 极 少 数 的 哑 终 端 文 持 彩 色 显 示 功 能 ， 所 以 大 多 数 早期 
的 curses EX 数 库 都 不 支持 色彩 。 如今 ， ncurses 和 其 他 大 多 数 现代 的 
curses 实 现 版 本 都 提供 了 对 它 的 支持 。 但 遗憾 的 是 ， curses EX Æ AY) “Aly 
DERE” H RRM 了 其 API，curses 只 能 以 一 种 非常 受 限 的 方式 来 使 用 彩 
色 ， 这 反映 了 早期 彩色 终端 显示 色彩 能 力 的 缺乏 。 

屏幕 上 的 每 个 字符 位 置 都 可 以 从 多 种 颜色 中 选择 一 种 作为 它 的 前 
景色 或 背景 色 。 例 如 ， 你 可 以 在 红色 背景 上 写 绿 色 的 文本 。 

curses 函 数 库 对 颜色 的 文 持 有 些 与 众 不 同 ， 即 字符 颜色 的 定义 及 其 
背景 色 的 定义 并 不 完全 独立 。 你 必须 同时 定义 一 个 字符 的 前 景色 和 背 
景色 ， 我 们 将 它 称 之 为 颜色 组 合 (color pair) ° 

在 使 用 curses 函 数 库 的 颜色 功能 之 前 ， 你 必须 检查 当前 终端 是 否 文 
} 示 功能 ， 然 后 对 curses 的 颜色 例 程 进行 初始 化 。 为 完成 这 个 任 

， 你 需要 使 用 两 个 函数 : has_colors 和 start_color: 


#include <curses.h> 


bool has colors(void); 
int start color(void); 


如 果 终 端 文 持 彩色 显示 ，has_colors 函 数 将 返回 true。 然 后 ， 你 需 
要 调用 start_color 函 数 ， ANAT EESTI Ae 化 了 颜色 显示 功能 ， 它 将 
返回 OK 。 一 旦 start_color 函 数 被 成 功 调 用 ， 变 量 COLOR_PAIRS 将 被 设 
置 为 终端 所 能 文 持 的 颜色 组 合 数目 的 最 大 值 ， 一 般 常 见 的 最 大 值 为 
64。 变 量 COLORS 定 义 可 用 颜色 数目 的 最 大 值 ， 一 般 只 有 8 种 。 在 内 部 
实现 中 ， 每 种 可 用 的 颜色 以 一 个 从 0 到 63 的 数字 作为 其 唯一 的 ID 号 。 

在 把 颜色 作为 属性 使 用 之 前 ， 你 必须 首先 调用 init 
使 用 的 颜色 组 合 进行 初始 化 。 对 颜色 属性 的 访问 是 通过 COLOR_PAIR 
函数 来 完成 的 : 


#include <curses.h> 


int init pair(short pair number, short foreground, short background); 
int COLOR PAIR(int pair number); 
int pair content(short pair number, short *foreground, short *background); 


头 文 件 curses.h 通 常会 定义 一 些 基 本 颜色 ， 它 们 的 名 字 以 COLOR_ 
为 前 缀 。 另 外 还 有 个 函数 pair_content， 它 的 作用 是 获取 已 定义 的 颜色 


组 合 的 信息 。 下 面 的 语句 将 红色 前 景 绿色 背景 定义 为 一 号 颜色 组 合 : 


然后 ， 通 过 调用 COLOR_PAIR 函 数 ， 将 该 颜色 组 合作 为 属性 来 访 
fa]: 


e x 0 
9 红色 内 容 。 

因为 一 个 COLOR_PAIR 束 是 一 个 属性 ， 所 以 可 以 把 它 与 其 他 属性 
结合 起 来 。 在 个 人 电脑 上 ， 你 通常 通过 “ 按 位 或 "将 COLOR_PAIR 属 性 
和 附加 属性 A_BOLD 相 结合 来 实现 高 浓度 的 颜色 : 


下 面 通过 示例 程序 color.c 来 查看 这 些 丽 数 的 使 用 情况 。 
实 验 彩色 


(1) 首先 检查 这 个 程序 的 显示 终端 是 否 支 持 彩 色 显 示 ， 如 采 支 
持 ， 束 局 用 彩色 显示 : 


(2) 现在 ， 你 可 以 打印 出 终端 可 用 颜色 数目 的 最 大 值 及 文 持 的 颜 
色 组 合 的 最 大 值 。 然 后 ， 程 序 创建 7 个 颜色 组 合并 一 次 显示 一 个 : 


available" 


refresh{); 


init pair(i, COLOR RED, COLOR BLACK); 
init pair(2, COLOR RED, COLOR, GREEN! ; 
init pair(3, COLOR GREEN, 
init pair(4, COLOR YE ee 


init.pair(5, COLOR BLAC WHITE): 
init pair(6, piante ai COLOR, BLUE) I 
init pair(7, COLOR CYAN, COLOR, WHITE; 
for (íi 1; i <= 7; i++) 

actroff (A. BOLD) 

attrset CGLOR, PATK(U)); 

mvprintw(5 + i , *Color pair *d', 1): 


attrset|COLOR PAIRI i A BOLD!: 
mvprintwi5 + i, 25, *Bold color pair td", i 


refresnh(íi 
gieep(1l: 
1 
} 
endwinl): 


exit(EXIT SUCCESS 


zr ee 图 中 缺少 了 实际 的 色 
彩 ， 这 是 当然 的 ， 因 为 这 是 一 张 黑 日 的 屏 蒂 截图。 


file Edit View Terminal Tabs Help 


There are 8 COLORS, and 64 COLOR PAIRS available 
Color pair i Bold color pair 1 


Color pair 4 ra 


color 6 


实验 解析 

在 检查 确认 屏幕 文 持 彩色 显示 之 后 ， 程 序 初始 化 颜色 处 理 并 定义 
了 一 些 颜色 组 合 。 然 后 ， 程 序 使 用 这 些 闫 色 组 合 将 一 些 文本 写 到 屏幕 
上 ， 以 显示 不 同 颜色 组 合 的 效果 。 


重新 定义 颜色 


FARINE ig [8] — 83 [RI Be Sz HE TH RAE PSS, [E OE AA 
PSH) ARB SSE TAC, HP RR A CHESS, curses EARL 
fe npitiitinit colors BOY il ETT ETE X: 

#include «curses.h» 


int init color(short color number, short red, short green, short blue); 
这 个 函数 可 以 将 一 个 已 有 的 颜色 (范围 从 0 到 COLORS) 以 新 的 亮 
度 值 重新 定义 ， 亮 度 值 的 范围 从 0 到 1 000。 这 有 点 像 为 GIF 格式 的 图 片 
定义 颜色 值 。 


6.9 pad 


在 编写 更 高 级 的 curses 程 序 时 ， 有 时 需要 先 建立 一 个 逻辑 屏幕 ， 然 
后 再 把 它 的 全 部 或 部 分 内 容 和 输出 到 物理 屏幕 上 。 有 时 候 ， a ae 
个 尺寸 大 于 物理 屏幕 的 逻辑 屏幕 ， 一 次 只 显示 该 逻辑 屏幕 的 某 个 

， 其 效果 往往 会 更 好 o 

但 使 用 到 目前 为 止 所 学 过 的 curses 函 数 来 实现 这 一 功能 并 不 容易 ， 
因为 任何 窗口 的 尺寸 都 不 能 大 于 物理 屏幕 。curses 提 供 了 一 个 特殊 的 数 
据 结构 pad 来 解决 这 一 问题 ， 它 可 以 控制 尺寸 大 于 正常 窗口 的 逻辑 屏 
EE o 


pad 结 构 非 常 类 似 WINDOW 结 构 ， 所 有 执行 写 窗 口 操 作 的 curses 函 
数 同样 可 用 于 pad。pad 还 有 其 目 己 的 创建 男 数 和 刷新 函数 。 
创建 pad 的 方式 与 创建 正常 窗口 的 方式 基本 相同 : 


#include <curses.h> 


WINDOW *newpad(int number of lines, int number of columns); 


需要 注意 的 是 ， 这 个 函数 的 返回 值 是 一 个 指 癌 WINDOW 结 构 的 指 
针 ， 这 一 点 与 newwin 函 数 相 同 。pad 用 delwin 函 数 来 删除 ， 这 与 正常 窗 
口 的 删除 一 样 。 | 

pad 使 用 不 同 的 画 数 执行 刷新 操作 。 因 为 一 个 pad 并 不 局 限于 茶 个 
特定 的 屏幕 位 置 ， 所 以 必须 指定 希望 放 到 屏幕 上 的 pad 范 围 及 其 放置 在 
屏幕 上 的 位 置 。prefresh 函 数 用 于 完成 这 一 功能 : 


#include <curses.h> 


int prefresh(WINDOW *pad ptr, int pad row, int pad column, 
int screen row min, int screen col min, 
int screen row max, int screen col max); 


这 个 函数 的 作用 是 将 pad 从 坐标 (pad. row, pad.column) 开始 的 区 
域 写 到 屏幕 上 指定 的 显示 区 域 ， 该 显 不 区 域 的 范围 从 坐标 
screen row. min, screen col min ) 到 
(screen row. max,screen col max 
curses 还 提供 了 Bipoutefresh. 'E BTE Fd 5j ER SX wnoutrefresh — 
样 ， 都 是 为 了 更 有 将 地 更 新 屏幕 
我 们 通过 程序 pad.c 来 查 Bu 数 的 使 用 方法 。 


实 验 使 用 pad 


(1) 在 程序 的 开始 首先 初始 化 pad 结 构 ， 


然后 创建 一 个 pad， 创 建 


pad 的 画 数 将 返回 一 个 指 向 该 pad 的 指针 。 用 字符 填充 这 个 pad 结 构 UE 


Ee ZAR | 


IA, 


显示 区 域 的 长 度 及 视 度 各 多 出 50 个 字符 


Sinclude ace.h 
tinclude dlib.h 
ftincluds raen.h 
int main 


pad, col 
x x ped lines; xe+) | 
for (y * 0; y < pad cols; ) 
mvwaddchipad ptr, x, y, disp.char]): 
if [disp char == '2') disp char * ‘a 


eise disp char**| 


(2) 现在 将 pad 的 不 同 区 域 绘制 到 屏幕 的 不 同位 置 上 ， 


程序 : 


ase pad.ptr, 5. 7, 2, 2, 3. 9): 
sleepil 


pref reshipad ptr, INES + 


rick Tlocathoat:~/bipée/choa 


Bile Edit Yew Terminal Tes Help 
i 


opqrstuy 

fghi jkla 

wxyzabct 
noprstuvwryzabcdet 
cfg1jklanopqrituvw 
vwxzabcáe ghi jk lan 
anoqrstuvwxyzobcde 
defhijklenopqrstuv 
yzabcdefghl j kia 
pqrstuvwxytabcd 
9ghi j'ienoparstu 
xyznbcdetghi jk i 
opqrstuvwxyzab« 
tohs jkienapqret 
wxyz2abcóde f gh; jk 
nopar tiw y rab 
wfghá jklanopurs 
vwx yrnbedetohi j 
(sluvwayse 
feton pki mnopqr 
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) 


然后 结束 


ER o 


6.10 CD 唱片 应用 程 


现在 ， 你 已 学 习 完 curses 函 数 库 提 供 的 功能 ， 下 面 可 以 开发 一 个 样 
本 应 用 程序 了 。 下 面 的 C 语 言 版 本 的 样本 程序 使 用 了 curses 函 数 库 ， 这 
使 得 屏 硕 显示 的 信息 更 加 束 刘 规范， 并 且 它 用 一 个 深 动 窗口 来 显示 曲 


目 清单 。 

整个 应 用 程序 长 达 8 页 ， 所 以 我 们 将 其 分 割 为 几 个 部 分 。 完 整 的 源 
代码 curses_app.c 可 以 从 Wrox 出 版 社 的 Web 站 点 上 获取 。 这 个 程序 与 本 
书 中 的 其 他 程序 一 样 ， 都 遵循 GNU 公 共 许 可 证 。 


CD 数据 库 应 用 程序 的 这 个 版 本 使 用 了 前 面 章节 所 提供 的 信 
息 。 它 源 于 第 2 章 里 的 shell 脚 本 程序 。 我 们 并 未 针对 C 语 言 实现 版 
本 对 该 程序 进行 重新 设计 ， 所 以 你 还 可 以 从 这 个 版 本 中 看 到 很 多 
原来 shell 脚 本 的 特征 。 要 注意 的 是 ， 这 个 实现 版 本 还 有 一 些 明 显 
的 不 足 ， 我 们 将 在 后 面 的 修订 版 本 中 加 以 解决 。 


我 们 将 这 个 应 用 程序 的 代码 分 割 为 几 个 部 分 ， 并 以 下 面 各 小 市 的 


标题 加 以 说 明 。 这 里 所 使 用 的 代码 编排 规定 与 本 书 的 其 他 部 分 不 太一 
a 在 这 里 ， 阴 影 部 分 的 代码 只 用 于 显示 对 应 用 程序 里 其 他 函数 的 调 


6.10.1 CD 唱片 应 用 程序 也 


代码 的 第 一 部 分 只 用 于 声明 将 在 后 面 用 到 的 变量 和 函数 ， 并 初始 
化 一 些 数据 结构 : 
(1) 首先 ， 包 含 所 有 必需 的 头 文件 ， 并 定义 一 些 全 局 常量 : 


(2) 现在 ， 需 要 定义 一 些 全 局 变量 。 变 量 current_cd 用 于 保存 正 
在 处 理 的 当前 CD 唱片 的 标题 。 该 变量 的 第 一 个 字符 被 初始 化 为 空 字符 
null， 表 示 用 户 还 未 选择 CD 唱片 。 改 0 并 不 是 绝对 必需 的 ， 但 它 能 确保 
该 变量 被 初始 化 了 ， 而 这 通常 是 件 好 事 。 变 量 current_cat 用 于 记录 当前 
CD 唱片 的 分 类 号 。 


(3) 接 下 来 是 一 些 文件 名 的 声明 。 为 简单 起 见 ， 这 个 版 本 中 的 文 
件 名 都 是 固定 的 ， 临 时 文件 的 文件 名 也 是 如 此 。 


但 如 果 有 两 个 用 户 在 同一 目录 下 同时 运行 这 个 程序 ， 就 会 出 
现 问题 。 获 得 数据 库 文 件 名 的 更 好 方法 是 通过 程序 的 参数 或 是 环 
境 变 量 。 我 们 也 需要 一 种 更 好 的 方法 来 生成 一 个 唯一 的 临时 文件 
和 名， 这 可 以 通过 POSIX 的 tmpnam 画 数 来 完成 。 我 们 将 在 第 8 章 使 
用 MySQL 存 储 数据 时 解决 这 些 问 题 。 


(4) 最 后 ， 给 出 所 有 而 数 的 原型 定义 : 


(5) 在 查看 这 些 函 数 的 具体 实现 之 前 ， 你 需要 定义 一 些 菜单 结构 
(实际 上 是 一 个 菜单 选项 的 数组 ) 。 当 一 个 菜单 选项 被 选中 时 ， 其 第 
一 个 字符 将 被 返回 。 例 如 ， 如 果 有 表单 选项 是 Add New CD ， 那 么 当 这 个 
选项 被 选中 时 ， 字 符 a 将 被 返回 。 当 用 户 选中 一 张 CD 唱 片 后 ， 扩 展 的 
表单 选项 extended_menu 将 被 显示 : 


char ‘main menu[] = 
I 


“add new CD*, 
*find CD*, 
"count CDs and tracke in the catalog", 
*quíit*, 
0, 
H 
char *extended menu[] = 
t 
*add new CD', 
*find CD*, 
count CDs and tracks in the catalog’, 
*list tracks on current CD*, 
*renove current CD’, 
"update track information", 
"quit", 
0, 
j; 


上 面 的 内 容 结束 了 程序 的 初始 化 过 程 。 接 下 来 ， 可 以 开始 进入 程 
序 中 的 函数 了 。 但 首先 ， 需 要 了 解 这 些 函 数 之 间 的 相互 关系 ， 如 图 6-9 
所 示 ， 一 共有 16 个 函数 ， 分 为 如 下 3 类 : 

O “绘制 菜单 

O “将 CD 唱片 资料 添加 到 数据 库 中 

O 获取 和 显示 CD 唱片 数据 


GET. CHOICE ML afer LIST Saal xs || REMOVE CT || UPDATE cp 


DRAW MENI INSERT TITLE EX. Ld GET RE | GET RETURN | RN UE REMOVE TRACKS 


GET. STRING GET, CONFIRM 
CLEAR. ALI Say) 


6.10.2 main AS 


main EA aX fo Yr FH PAJA SE ER rRETTXSTE, EEE quit (退出 ) A 
止 ， 如 下 所 示 : 


下 面 我 们 分 别 对 程序 中 的 3 类 函数 进行 分 析 。 
6.10.3 Y. 


AT EUR RPP Pe I RP NRL o 
(1) main Kry H A getchoice HAVE AS T AYE E ERZ 9 getchoice 
函数 的 参数 有 : greet — —/T 2818, choices——fs EKARI REGE 
单 《这 取决 于 用 户 是 否 选择 了 一 张 CD 唱 片 ) 。 你 可 以 在 前 面 的 main 函 
数 中 看 到 main_menu 或 extended_menu 是 如 何 作 为 参数 传递 的 : 


int getchoice(char *greet, char *choíces[]] 
( 
static int selected row = 0; 
int max row = 0; 
int start screenrow * MESSAGE LINE, start screencol = 10; 
char **opticn: 
int selected; 
int key = D; 


option * choices; 
while [*option) [ 
max rows; 
optione; 
! 
/* protect against menu getting shorter when CD deleted */ 
if (selected row >= max, tow| 
gelected row = 0: 
clear all screen(); 
mevprintw|start screenrow ~ 2, start screencol, greet] 
keypad(stiscr, TRUE); 
cbreak!] : 
noecho!) ; 
key = 0; 
while [key |= 'q' && key !* KEY ENTER &k key [= ''in'! 
if (key == KEY UP!) | 
£f iselected row == 0] 
pelected row = max row = l} 
eise 
selected row-- 
} 
if (key == KEY DOWN! 
if |selected, row 
peiected row = 0; 
else 
Belected row**; 


} 

selected = *choices[selected rcw]; 

draw menu(choices, selected row, start screenrow, 
start screencoll;i 

key = getch!]:; 


4 
, 


keypadistdscr, FALSE); 
nocbreak!!: 
echot); 


tf tkey == 'q') 


gelected = 'q'; 


return (selected); 


(2) getchoice EX Zi N ZB 8 FA T AAK: clear all screen #il 
draw. menu ° RI 503% 4 @ draw_menukK Rv: 


(3) 接 下 来 是 clear_all_screen 函 数 ， 让 人 惊讶 的 是 ， 它 只 是 清 屏 
ae 。 如 果 用 户 选 中 了 一 张 CD 唱 片 ， 则 在 屏幕 上 显示 它 的 


6.10.4 ”操作 数据 库 文 件 


本 下 介绍 用 于 添加 或 更 新 CD 数据 库 的 函数 。 被 main 函 数 调用 的 函 
数 有 : add_record、update_cd 和 remove_cd。 
1. 添加 记录 
5 D m. 张 新 CD 唱片 的 资料 到 数据 库 : 


har cd. c MAX STRING 
ar cd tyr (AX STRING] 

har cd a [MAX ST 

har cd a MAX STR 


clear all screen(); 


mvprintw(screenrow, screencol, "Encer new D deca 


mvprintwiscreenrow, screencol, *Catalog Numbe 
get string(catalog number |; 


screenrowe-+ 


mvprintwi reenrow, screencol x 
get .srring(cd title); 
screenrowe- 

mvprintwiscreenrow, screenco E D Tyr 
get_string(cd_type}; 

screenrowes 

Vprintwiscreemrow, screencoi i Artist 
get_string(cd_artist!: 

screenrowe* 


move PROMPT. LINEI 

if (get confirm|)) ‘ 
insert.title(cd. entry] ; 
strcpy(current cd, ed tritie!; 


SCICpY current cat catalog number 


(2) get string ER 2X) TE Hd zi M DERE S3 B br CEU T 48 R, 
并 将 其 末尾 可 能 存在 的 新 行 符 删 除 : 


void get stringichar *string 


string[len 


| 
(3) get._confirm 冰 克 提示 并 读 取 用 户 的 确认 信息 。 它 读 取 用 户 的 输入 字符 囊 ， 恰 查访 字符 籼 的 


(3) get_confirm 函 数 提示 并 读 取 用 户 的 确认 信息 。 它 读 取 用 户 
的 输入 字符 串 ， 检 查 该 字符 串 的 第 一 个 字符 是 否 是 Y 或 y， 如 果 是 其 他 
字符 ， 则 认为 用 户 未 确认 : 


(4) Ba, BAK A insert_title Nay o CAEH EK el FF P 
Ee IUe DUM p 


2. 更 新 记录 

(1) main KO ANAS CF BEE ER Be update_cd ° XS ER 
数 使 用 了 一 个 禹 边框 、 可 卷 屏 的 子 和 帘 口 ， 它 需要 用 到 一 些 和 常量 ， 由 于 
这 些 常 量 在 后 面 的 list_ tracks 范 数 中 还 会 用 到 所 以 这 些 常量 被 定义 为 


Ana F 


(2) pem cd 函数 允许 用 户 重 新 输入 当前 CD 唱片 中 的 曲目 。 在 
删除 以 前 的 曲目 记录 后 ， 它 会 提示 用 户 输入 新 资料 : 


我 们 将 在 下 面 继续 列 出 这 个 画 数 的 剩余 代码 。 在 这 里 ， 我 们 
稍 作 停顿 ， 解 释 一 下 如 何在 带 边框 的 卷 屏 窗口 中 输入 数据 。 这 里 
使 用 的 技巧 是 先 创建 一 个 子 窗口 ， 围 绕 它 画 一 个 边框 ， 然 后 在 这 
个 带 边框 的 子 窗口 中 再 添加 一 个 新 的 卷 屏 子 窗口 。 


3. 删 除 记 录 
main 函数 调用 的 最 后 一 个 操作 数据 库 的 函数 是 remove_cd: 


] remove 


(2) 现在 ， 只 需要 列 出 remove_tracks 函 数 。 该 函数 的 作用 是 删除 
当前 CD 唱片 中 的 曲目 记录 。 它 同时 被 update_cd 函 数 和 remove_cd 函 数 
调用 : 


MAX ENTRY 


6.10.5 ”查询 CD 数据 库 


本 节 介 绍 如 何 访 问 数据 ， 为 便于 访问 ， 数 据 被 存储 在 一 对 平面 文 
件 中 ， 并 以 逗号 作为 字段 的 分 隔 符 : 
(1) 所 有 收集 嗜好 的 本 质 都 是 为 了 了 解 你 收集 的 东西 数量 有 多 
少 。 下 面 这 个 函数 束 是 用 来 执行 这 个 任务 的 。 它 对 数据 库 进 行 扫描 并 
统计 出 总 的 唱片 数目 和 曲目 数 : 


get returni} 


(2) 如 果 不 小 心 将 最 喜欢 的 CD 唱片 的 标签 弄 丢 了 ， 不 用 担心 ! 
由 于 已 经 将 CD 唱片 的 详细 信息 录入 数据 库 ， 所 以 可 以 通过 调用 find_cd 
函数 来 查找 曲目 清单 。 它 提示 用 户 输入 一 个 字符 串 ， 根 据 该 字符 溃 在 
数据 库 中 进行 匹配 检索 ， 并 把 找到 的 CD 唱片 标题 放 入 全 局 变量 


current_cd 中 : 


void find_cd 


ot 


虽然 catalog 指 回 的 数组 比 current_cat 要 大 ， 并 且 很 可 能 会 覆盖 

存 ， 但 在 fgets 函 数 中 的 检查 就 不 会 发 生 上 述 问 题 。 
(3) 还 需要 把 用 户 选中 的 CD 唱片 中 的 曲目 列 在 屏幕 上 。 这 里 会 
用 到 在 上 一 小节 中 为 update_cd 画 数 中 的 于 窗口 使 用 万 定 义 的 全 局 稼 


Æ: 


mvprintw(4, O0, *CD Track Listing\n"); 


/* write the track information into the pad */ 


while [fgets(entry, MAX ENTRY, tracks, _fp)) ( 
/* Compare catalog number and output rest of entry */ 
if (strnemo (current cat, entry, cat length) =e 0) | 
mvwprintw[track pad ptr, lines opr*, 0, *ts*, 
entry + cat length + 1); 


} 
! 
fclose[tracks fp); 


if (lines op > BOXED LINES) + 

mvprintw|MESSAGE LINE, 0, 

*Cursor keys to scroll, RETURN or q to exit*]; 

} else { 

mvprintwi!MESSAGE LINE, 0, “RETURN or q to exit*]; 
) 
wrefresh|stdscr|; 
keypad(stdscr, TRUE); 


cbreak|); 

noecho(|); 

key * D; 

while (key != 'q' && key != KEY ENTER 44 key f= '\n') | 


if (key == KEY_UP) ( 
if ifirst líne > 0) 
first líne--; 
} 
if (key == KEY DOWN) ( 
if |first line + BOXED LINES + 1 < tracks) 
first linee»; 
} 
/* now draw the sppropriate part of the pad on the screen */ 
prefresh(track pad prr, first line. 0, 
BOX LINE POS, BOX ROM, POS, 
BOX LINE POS + BOXED LINES, BOX, ROW POS + BOXED, ROMS); 
key = getch!]; 


delwin|track pad ptr!; 
keypadistdscr, FALSE); 
nocbreak!!; 

echoll;: 


(4) BUD SEN Bab US T get reunit, "BE HH Æ tH 
户 按 下 回 车 键 并 读 取 它 ， 其 他 字符 将 被 忽略 : 


void get retum() 
( 


int ch: 
mvprintw(23, 0, **s*, * Press return 


*)1i 


refresh); 
while [lch = getchar()) != ‘\n' && ch i= BOF); 


运行 这 个 程序 ， 你 将 看 到 如 图 6-10 所 示 的 输出 结 采 。 


rickglocalhost:-/blpae;chüb/app 


File Edit View Terminal Tabs Help 


CD Database Application 


Options: 


find CD 

count CDs and tracks in the catalog 
list tracks on current CD 

remove current CO 

update track intormation 

quit 


Move highlight then press Return 


Current CO: 625438759: I Glorni 


6.11 小 结 


EREE, KIIMA T curses HRUE ° curses AT ARAI ENF pE 
供 了 控制 屏幕 和 读 取 键 盘 输入 的 好 方法 。 与 通用 终端 接口 (GTD 和 
直接 terminfo 数 据 库 访 问 相 比 ， 虽 然 curses 并 未 提供 那么 多 的 控制 功 
能 ， 但 它 更 易于 使 用 。 如 果 你 正在 编写 一 个 全 屏 的 、 基 于 文本 的 应 用 
程序 ， 就 应 该 考虑 使 用 curses 范 数 库 来 管理 屏幕 和 键盘 。 


第 7 章 ”数据 管理 


在 前 面 的 音节 中 我 们 介绍 了 资源 限制 的 问题 。 在 本 章 中 ， 我 
们 将 首先 介绍 资源 分 配 的 管理 方式 ， 然 后 介绍 如 何 对 可 能 被 多 个 用 户 
同时 访问 的 文件 进行 处 理 ， 最 后 介绍 一 个 Linux 系 统 提 供 的 工具 ， 我 们 
可 以 利用 它 来 克服 以 普通 文件 作为 数据 存 迪 介质 时 受到 的 限制 。 

我 们 可 将 这 些 问题 归纳 为 数据 管理 的 3 个 方面 。 

口 “ 动 态 内 存 管理 : 可 以 做 什么 以 及 Linux 不 允许 做 什么 。 

o “文件 锁定 : 协调 锁 、 共 享 文件 的 锁定 区 域 和 避免 死 锁 。 

口 _dbm 数 据 库 : 一 个 大 多 数 Linux 系 统 都 提供 的 、 基 本 的 、 不 基 

于 SQL 的 数据 库 函 数 库 o 


7.1 理 


在 所 有 计算 机 系统 中 ， 内 存 都 是 一 种 稀缺 货源 。 无 论 有 多 少 可 用 
内 存 ， 它 总 是 显得 不 够 。 在 过 去 ， 人 们 还 认为 256 MB 的 内 存 已 经 足够 
了 。 但 现在 ， 即 使 对 桌面 系统 ，2 GB 的 内 存 也 已 经 是 其 最 低 要 求 了 ， 
服务 侨 系 统 通常 需要 的 内 存量 束 更 多 了 。 

从 最 早期 的 操作 系统 版 本 开始 ，UNIX 风 格 的 操作 系统 就 以 一 种 非 
常 干净 的 方式 来 管理 内 存 ， 因 为 Linux 系 统 实现 了 X/Open 规 范 ， 所 以 
它 也 继承 了 这 一 特点 。 除 了 一 些 特殊 的 岁入 式 应 用 程序 以 外 ，Linux 程 
序 决 不 允许 直接 访问 物理 内 存 。 也 许 应 用 程序 看 起 来 好 像 可 以 这 样 
做 ,但 应 用 程序 看 到 的 只 是 一 个 精心 控制 的 假象 而 已 。 

Linux 为 应 用 程序 提供 了 一 个 简洁 的 视图 ， 它 能 反映 一 个 巨大 的 可 
直接 寻 址 的 内 存 空 间 。 此 外 ，Linux 还 提供 了 内 存 保护 机 制 ， 它 避免 了 
不 同 的 应 用 程序 之 间 的 互相 干扰 。 如 采 机 顺和 被 正确 配置 并 且 有 足够 的 
oo ，Linux 还 允许 应 用 程序 访问 比 实际 物理 内 存 更 大 的 内 存 空 
|E] ° 


7.1.1 E \ 
使 用 标准 C 语 言 函数 库 中 的 malloc 调 用 来 分 配 内 存 : 


#include <stdlib.h> 
void *mallocisize_t size); 


注意 ， 遵 循 XOpen 规 范 的 Linux 与 一 些 UNIX 系 统 不 同 ， 它 不 
要 求 包 售 malloc.h 头 文件 。 此 外 ， 用 来 指定 待 分 配 内 存 字 节 数量 的 
参数 size 不 是 一 个 简单 的 整 型 ,虽然 它 通 常 是 一 个 无 符号 整 型 。 


你 可 以 在 大 多 数 Linux 系 统 上 分 配 大 量 的 内 存 。 让 我 们 从 一 个 非常 
简单 的 例子 开始 ， 但 这 个 例子 却 足以 打败 旧式 的 基于 MS-DOS 的 程 
E 因为 在 DOS 下 的 程序 不 能 访问 超过 640 K 内 存 映 射 限制 的 内 存 范 
o 


实 验 简单 的 内 存 分 配 
输入 下 面 这 个 程序 memory1l.c: 


运行 这 个 程序 时 ， 它 的 输出 如 下 所 示 : 


memoryl 


实验 解析 

这 个 程序 要 求 malloc 范 数 给 它 返 回 一 个 指向 IMB 内 存 空间 的 指 
针 。 首 先 检 查 并 确保 malloc 函 数 被 成 功 调 用 ， 然 后 通过 使 用 其 中 的 部 
分 内 存 来 表明 分 配 的 内 存 确实 已 经 存在 。 当 运行 这 个 程序 时 ， 你 会 看 
到 程序 输出 Hello World， 这 表明 malloc 确 实 返回 了 1MB 的 可 用 内 存 。 
我 们 并 未 对 这 个 1MB 的 空间 进行 全 面 检查 ， 对 于 malloc 调 用 的 代码 总 
得 有 点 信任 吧 ! 

注意 ， 由 于 malloc 函 数 返 回 的 是 一 个 void* 指 针 ， 因 此 需要 通过 类 
型 转换 ， 将 其 转换 至 你 需要 的 char* 类 型 指针 。malloc 函 数 可 以 保证 其 
返回 的 内 存 是 地 址 对 齐 的 ， 所 以 它 可 以 被 转换 为 任何 类 型 的 指针 。 

可 以 这 样 做 的 原因 很 简单 ， 因 为 目前 大 多 数 Linux 系 统 都 使 用 32 位 
的 整数 和 32 位 的 指针 来 指向 内 存 ，32 位 的 指针 可 寻 址 的 地 址 空间 可 达 4 
GB。 系 统 和 直接 用 32 位 的 指针 来 寻 址 ， 而 不 再 需要 上 段 寄 存 絮 或 其 他 技巧 
的 能 力 被 称 为 32 位 平面 内 存 模型 。 这 个 模型 还 被 用 于 32 位 版 本 的 
Windows XP 和 Vista 系 统 。 但 你 并 不 能 因此 认为 整数 永远 都 是 32 位 的 ， 
因为 正 有 越 来 越 多 的 64 位 Linux 版 本 投入 实际 使 用 。 


7.1.2 EP 


现在 ， 你 已 经 看 到 Linux 能 轻松 打破 MS-DOS 内 存 模型 的 上 限 ， 我 
们 不 妨 给 它 出 个 更 难 的 题目 。 下 面 这 个 程序 将 请 求 系 统 分 配 比 机 侣 本 
喘 所 拥有 的 物理 内 存 更 多 的 内 存 。 你 可 能 会 认为 ，malloc 会 在 接近 实 


际 物理 内 存 容量 的 某 个 地 方 出 现 问 题 ， 因 为 内 核 和 其 他 运行 中 的 程序 
也 会 占用 部 分 内 存 。 


实 验 请 求全 部 的 物理 内 存 
在 程序 memory2.c 中 ， 我 们 将 请 求 比 机 器 物理 内 存 容量 更 多 的 内 
存 。 你 需要 根据 机 器 的 具体 情况 来 调整 宏 定义 PHY_MEM_MEGS: 


include <stdlib.h> 
Sinclude <stdio.h> 


1e PHY MEM MESS 


这 个 程序 的 输出 如 下 所 示 ， 我 们 对 输出 结 采 做 了 一 些 简化 : 


$ ./menorya 


实验 解析 

这 个 程序 与 前 面 的 例子 十 分 类 似 。 它 只 是 通过 循环 来 不 断 申 请 越 
来 越 多 的 内 存 ， 直 到 它 已 分 配 了 在 PHY_MEM_MEGS 中 定义 的 物理 内 
存 容 量 的 2 倍 为 止 。 看 上 去 这 个 程序 似乎 耗 尽 了 机 右上 物理 内 存 中 的 每 
个 字 节 ， 但 出 乎 意料 的 是 这 个 程序 竟然 运行 良好 。 注 意 ， 我 们 为 
malloc 调 用 的 参数 使 用 了 size_t 类 型 。 

另 一 个 有 趣 的 现象 是 ， 至 少 在 我 的 这 人 台 机 器 上 ， 整 个 程序 的 运行 
时 间 也 就 是 一 肛 眼 的 功夫 。 也 就 是 说 ， 我 们 不 仅 很 明显 地 耗 尽 了 所 有 
的 内 存 ， 而 且 还 非常 快速 。 

我 们 用 程序 memory3.c 做 进一步 的 研究 ， 看 看 这 人 台 机 器 到 撒 有 多 少 
内 存 可 以 分 配 。 因 为 现在 我 们 能 很 清楚 地 发 现 Linux 在 处 理 内 存 请 求 时 


FDU FSF Fe AAA, At ABA AR BER AT CK F PAFA EARE 
个 内 存 块 上 写 入 数据 。 


x 验 可 用 内 存 
下 面 束 是 程序 memory3.c 的 源 代 码 。 束 其 本 质 而 言 ， 这 个 程序 对 于 
系统 极 不 友好 ， 而 且 会 严重 影响 一 人 台 多 用 户 机 器 的 运行 。 如 果 对 可 能 
ee 最 好 不 要 运行 它 ， 因 为 这 不 会 妨碍 你 对 这 部 分 内 容 
J£ F: 


这 一 次 ， 程 序 的 输出 如 下 〈 经 简化 ) : 


memory3 


然后 程序 就 结束 了 。 运 行 它 所 论 费 的 时 间 还 不 少 ， 并 且 当 分 配 的 内 存 
大 小 接近 机 硕 物 理 内 存 容量 时 ， 运 行 速度 明显 慢 了 下 来 ， 而 且 你 能 很 
明显 地 感觉 到 硬盘 的 操作 。 但 这 个 程序 还 是 分 配 了 大 大 超出 机 顺 物 理 
内 存 容 量 的 内 存 。 最 后 ， 系 统 为 了 保护 目 己 的 安全 运行 ， 终 止 了 这 个 
贪 梦 的 程序 。 在 一 些 系 统 中 ， 当 malloc 调 用 失败 时 ， 程 序 可 能 只 是 退 
出 而 不 输出 任何 内 容 。 

实验 解析 

应 用 程序 所 分 配 的 内 存 是 由 Linux 内 核 管理 的 。 每 次 程序 请 求 内 存 
或 者 答 试 读 写 它 已 经 分 配 的 内 存 时 ， 便 会 由 Linux 内 核 接 管 并 决定 如 何 


处 理 这 些 请 求 。 

刚 开始 时 ， 内 核 只 是 通过 使 用 空 闻 的 物理 内 存 来 满足 应 用 程序 的 

内 存 请 求 ， 但 是 当 物 理 内 存 耗 尽 时 ， 它 便 会 开始 使 用 所 谓 的 交换 空间 

(swap space) 。 在 Linux 系 统 中 ， 交 换 空 间 是 一 个 在 安装 系统 时 分 配 
的 独立 的 磁盘 区 域 。 如 果 见 悉 Windows 操 作 系 统 的 话 ，Linux 交 换 衬 间 
的 作用 有 点 像 隐藏 的 windows 交 换文 件 。 但 与 Windows 不 同 ，Linux 的 
交换 空间 中 没有 局 部 堆 、 全 局 堆 或 可 丢弃 内 存 段 等 需要 在 代码 中 操心 
的 内 容 一 一 Linux 内 核 会 为 你 完成 所 有 的 管理 工作 。 

内 核 会 在 物理 内 存 和 交换 空间 之 间 移 动 数 据 和 程序 代码 ， 使 得 每 
次 读 写 内 存 时 ， 数 据 看 起 来 总 像 是 已 存在 于 物理 内 存 中 ， 而 不 管 在 你 
访问 它们 之 前 ， 它 们 究竟 是 在 哪里 。 

用 更 专业 的 术语 来 说，Linux 实 现 了 一 个 “ 按 需 换 页 的 虚拟 内 存 系 
统 *”。 用 户 程 序 看 到 的 所 有 内 存 全 是 虚拟 的 ， 也 就 是 说 ， 它 并 不 真正 存 
在 于 程序 使 用 的 物理 地 址 上 。Linux 将 所 有 的 内 存 都 以 页 为 单位 进行 划 
分 ， 通 常 每 一 页 的 大 小 为 4096 字 下。 每 当 程 序 试图 访问 内 存 时 ， 吏 会 
发 生 虚 拟 内 存 到 物理 内 存 的 转换 ， 转 换 的 具体 实现 和 耗费 的 时 间 取 决 
于 你 所 使 用 的 特定 硬件 情况 。 当 所 访问 的 内 存在 物理 上 并 不 存在 时 ， 
就 会 产生 一 个 页 面 错 误 并 将 控制 权 交 给 内 核 。 

Linux 内 核 会 对 访问 的 内 存 地 址 进行 检查 ， 如 果 这 个 地 址 对 于 程序 
来 说 是 合法 可 用 的 ， 内 核 束 会 确定 需要 问 程 序 提供 哪 一 个 物理 内 存 页 
面 。 然 后 ， 如 果 该 页 面 之 前 从 未 被 写 入 过 ， 内 核 承 直接 分 配 它 ， 如 果 
它 已 经 被 保存 在 硬盘 的 交换 空间 上 ， 内 核 束 读 取 包 含 数 据 的 内 存 页 面 
到 物理 内 存 (可 能 需要 把 一 个 已 有 页 面 从 内 存 中 移出 到 硬盘 ) 。 接 
着 ， 在 完成 虚拟 内 存 地 址 到 物理 地 址 的 映射 之 后 ， 内 核 允许 用 户 程序 
继续 运行 。Linux 应 用 程序 并 不 需要 操心 这 一 过 程 ， 因 为 所 有 的 具体 实 
现 都 已 隐藏 在 内 核 中 了 ° 

最 终 ， 当 应 用 程序 耗 尽 所 有 的 物理 内 存 和 交换 空间 ， 或 者 当 最 大 
ae 内 核 将 拒绝 此 后 的 内 存 请 求 ， 并 可 能 提前 终止 程序 

J 运行 。 


这 种 “终止 进程 > 的 行为 和 早期 的 Linux 版 本 以 及 许多 其 他 版 
本 的 UNIX 系 统 有 所 不 同 ， 后 者 只 是 让 malloc 失 败 。 这 在 术语 上 被 
称 为 < 内 存 耗 尽 (OOM) 杀手 ”。 尽 管 这 看 上 去 好 像 非常 严厉 ， 但 
实际 上 这 是 为 了 既 能 让 进程 快速 高 效 地 分 配 内 存 ， 又 能 让 Linux 
内 核 保 护 自己 免 受 资源 耗 尽 的 破坏 (这 是 一 个 严重 的 问题 ) 而 做 
的 一 个 很 好 的 妥协 。 


那么 ， 这 一 切 对 于 应 用 程序 的 程序 员 来 说 意味 着 什么 呢 ? 简单 地 
说 ， 这 都 是 好 消息 。Linux 非 常 善于 管理 内 存 ， 它 允许 应 用 程序 使 用 数 
量 非 第 巨大 的 内 存 ， 甚 至 使 用 一 个 单独 的 非 第 大 的 内 存 块 。 但 你 必须 
记 住 的 十 ,分 配 两 块 内 存 并 不 会 得 到 一 个 单独 的 可 以 连续 寻 址 的 内 存 
块 。 你 得 到 的 是 你 所 要 求 的 : 两 个 独立 的 内 存 块 。 

那么 ， 这 种 明显 的 没有 限制 的 内 存 供应 和 在 内 存 耗 尽 前 系统 提前 
终止 进程 的 做 法 是 否 意 味 着 ， 对 malloc 函 数 的 返回 值 进行 检查 没有 意 
MWE? 显然 不 是 。 在 使 用 动态 分 配 内 存 的 C 语 言 程序 中 ， 一 个 最 各 见 
的 问题 是 试图 在 一 个 已 分 配 的 内 存 块 之 后 写 数据 。 在 发 生 这 种 情况 
时 ， 程 序 可 能 并 不 会 立即 终止 ,但 你 可 能 已 覆盖 了 malloc 库 例 程 内 部 
使 用 的 一 些 数据 。 

通常 这 可 能 会 导致 后 续 的 malloc 调 用 失败 ， 但 这 并 不 是 因为 没有 
足够 的 内 存 可 以 分 配 ， 而 是 因为 内 存 的 结构 已 经 被 破坏 。 追 踩 这 类 问 
题 非常 困难 ， 在 程序 里 越 早 检测 到 这 类 错误 ， 束 越 有 机 会 找到 其 原 
因 。 在 本 书 的 第 10 章 介绍 调试 和 优化 的 时 候 ， 我 们 将 讨论 一 些 有 助 于 
追踪 这 类 内 存 问 题 的 工具 。 


7.1.3 ”混用 内 存 


假设 想 要 对 内 存 干 点 “坏事 *”。 在 下 面 这 个 程序 memory4.c 中 ， 先 分 
配 一 些 内 存 ， 然 后 尝试 在 它 之 后 写 些 数据 。 


x 验 WAWE 
#include <stdlib.h> 


Re Fr Aa ARIES, AU PHI: 


memory4 


实验 解析 

Linux 内 存 管 理 系统 能 保护 系统 的 其 他 部 分 免 受 这 种 内 存 滥用 的 影 
啊 。 为 了 确保 一 个 行为 恶劣 的 程序 (如 本 例 ) 无 法 破 化 任何 其 他 程 
序 ，Linux 会 终止 其 运行 。 

每 个 在 Linux 系 统 中 运行 的 程序 都 只 能 看 到 属于 目 己 的 内 存 映像 ， 
不 同 的 程序 看 到 的 内 存 映 像 不 同 。 只 有 操作 系统 知道 物理 内 存 是 如 何 
同时 也 为 用 户 程序 提供 彼此 之 
IR] AS) Bea HA o 


7.1.4 ZJ 


与 MS-DOS 不 同 ， 现 代 的 Linux 系 统 更 像 新 版 本 的 Windows 系 统 ， 
虽然 实际 的 行为 和 具体 实现 相关 ， 但 它 对 空 指针 指向 地 址 的 读 写 提供 
了 很 强 的 保护 。 


x 验 访问 空 指针 
我 们 通过 memory5a.c 程 序 来 看 看 访问 空 指针 时 会 发 生 的 情况 : 


其 输出 为 : 


menory5a 


实验 解析 

第 一 个 printf 范 数 试 图 打印 一 个 取 自 空 指针 的 字符 串 ， 授 着 sprintf 
函数 尝试 同一 个 空 指 针 里 写 数 据 。 在 本 例 中 ，Linux (EGNU CEH RU 
的 包装 下 ) 容忍 了 读 操 作 ， 它 只 输出 一 个 包含 (nul 入 0 的 “魔术 ? 字 
符 串 。 但 对 于 写 操 作 就 没有 如 此 宽容 了 ， 它 直接 终止 了 该 程序 。 这 在 
有 些 时 候 能 够 帮助 我 们 追踪 程序 中 的 漏洞 。 


如 果 再 斌 一次， 但 这 次 不 使 用 GNUC 画 数 库 ， 你 将 发 现 从 零 地 址 
处 读数 据 也 是 不 允许 的 。 请 看 下 面 的 memory5b.c 程 序 : 


其 输出 为 : 


memory5b 


DIK, MAMAN SHIA, m AEA ATR Z 
间 并 没有 GNU 的 libc 库 存在 ， 于 是 ， 程 序 被 终止 了 。 要 注意 的 是 ， 有 
些 版 本 的 UNIX 系 统 允许 从 零 地 址 处 读 取 数据 ， 但 Linux 不 允许 。 


7.15 PMA 


到 目前 为 止 ， 我 们 只 十 分 配 内 存 ， 然 后 希望 当 程序 结束 时 ， 我 们 
使 用 的 内 存 不 会 丢失 。 笠 运 的 是 ，Linux 内 存 管理 系统 完全 有 能 力 保证 
在 程序 结束 时 ， 把 分 配给 它 的 内 存 返 回 给 系统 。 但 是 ， 大 多 数 程序 需 
要 的 并 不 仅仅 是 分 配 一 些 内 存 ， 使 用 一 小 段 时 间 ， 然 后 就 退出 。 一 种 
更 和 常见 的 用 法 是 根据 宕 要 动态 地 使 用 内 存 。 

动态 使 用 内 存 的 程序 应 该 总 是 通过 free 调 用 ， 来 把 不 用 的 内 存 释 
放 给 malloc 内 存 管理 右 。 这 样 做 可 以 将 分 散 的 内 存 块 重 新 合并 到 一 
起 ， 并 由 malloc 范 数 库 而 不 是 应 用 程序 来 管理 它 。 如 果 一 个 运行 中 的 
程序 (进程 自己 使 用 并 释放 内 存 ， 则 这 些 自由 内 存 实际 上 仍然 处 于 
被 分 配给 该 进程 的 状态 。 在 幕后 ，Linux 将 程序 员 使 用 的 内 存 块 作为 一 
个 物理 页 面 集 来 管理 ， 通 常 内 存 中 的 每 个 页 面 为 4K 字 节 。 但 如 来 一 个 
内 存 页 面 未 被 使 用 ，Linux 内 存 管理 紫 束 可 以 将 其 从 物理 内 存 置 换 到 交 
换 空间 中 (术语 叫 换 页 ， 从 而 减轻 它 对 资源 使 用 的 有 影响。 如 果 程 序 
试图 访问 位 于 已 置换 到 交换 空间 中 的 内 存 页 中 的 数据 ， 那 么 Linux 会 短 
暂 地 暂 集 程序 ， 将 内 存 页 从 交换 空间 再 次 置换 到 物理 内 存 ， 然 后 允许 
程序 继续 运行 ， 束 像 数 据 一 直 存 在 于 内 存 中 一 样 。 


#include <stdlib.h> 


调用 free 时 使 用 的 指针 参数 必须 是 指向 由 malloc、calloc 或 realloc 调 
用 所 分 配 的 内 存 。 你 很 快 就 将 看 到 calloc 和 realloc 函 数 。 


X RRA 
下 面 这 个 程序 被 命名 为 memory6.c: 


dofine ONEK 024 


输出 结果 是 

实验 解析 

这 个 程序 显示 了 如 何 调用 free 来 释放 内 存 ，free 画 数 带 有 一 个 指向 
先前 分 配 内 存 的 指针 参数 。 


请 记 住 : 一 旦 调用 free 释 放 了 一 块 内 存 ， 它 就 不 再 属于 这 个 
进程 。 它 将 由 malloc 函 数 库 负责 管理 。 在 对 一 块 内 存 调 用 free 之 
后 ， 就 绝 不 能 再 对 其 进行 读 写 操 作 了 。 


7.1.6 ”其 他 内 存 分 配 函 数 


另外 两 个 内 存 分 配 函 数 并 不 像 malloc 和 free 使 用 的 那样 频繁 ， 它 们 
是 calloc 和 realloc， 其 原型 为 : 


tinclude <stdlib.h> 


void *calloc(size t number of elements, sizo t element si 
void *realloc(void *existing memory, size t new size); 


虽然 calloc 分 配 的 内 存 也 可 以 用 free 来 释放 ， 但 它 的 参数 与 malloc 
有 所 不 同 。 它 的 作用 是 为 一 个 结构 数组 分 配 内 存 ， 因 此 需要 把 元 素 个 
数 和 每 个 元 素 的 大 小 作为 其 参数 。 它 所 分 配 的 内 存 将 全 部 初始 化 为 0。 
如 果 calloc 调 用 成 功 ， 将 返回 指向 数组 中 第 一 个 元 素 的 指针 。 与 malloc 
调用 类 似 ， 后 续 的 calloc 调 用 无 法 保证 能 返回 一 个 连续 的 内 存 空 间 ， 
此 不 能 通过 重复 调用 calloc， 并 期 望 第 二 个 调用 返回 的 内 存 正 好 接 在 第 
一 个 调用 返回 的 内 存 之 后 来 扩大 calloc 调 用 创建 的 数组 。 

realloc 芳 数 用 来 改变 先前 已 经 分 配 的 内 存 块 的 长 度 。 它 需要 传递 
一 个 指 回 先前 通过 malloc、calloc 或 realloc 调 用 分 配 的 内 存 的 指针 ， 然 
后 根据 new_size 参 数 的 值 来 增加 或 减少 其 长 度 。 为 了 完成 这 一 任务 ， 
realloc 芳 数 可 能 不 得 不 移动 数据 ， 因 此 特别 重要 的 一 点 是 ， 你 要 确保 
一 旦 内 存 被 重新 分 配 之 后 ， 你 必须 使 用 新 的 指针 而 不 是 使 用 realloc 调 
用 前 的 那个 指针 去 访问 内 存 。 

另外 一 个 需要 注意 的 问题 是 ， 如 果 realloc 无 法 调整 内 存 块 大 小 的 
话 ， 它 会 返回 一 个 null 指 针 。 这 就 意味 着 在 一 些 应 用 程序 中 ， 你 必须 
避免 使 用 类 似 下 面 这 样 的 代码 : 


如 果 realloc 调 用 失败 ， 它 将 返回 一 个 空 指针 ，my_ptr 束 将 指 问 
null， 而 先前 用 malloc 分 配 的 内 存 将 无 法 再 通过 my_ptr 进 行 访问 。 
此 ， 在 释放 老 内 存 块 之 前 ， 最 好 的 方法 是 和 完 用 malloc 请 求 一 块 新 内 
存 ， 再 通过 memcpy 调 用 把 数据 从 老 内 存 块 复制 到 新 的 内 存 块 。 这 样 即 
使 出 现 错误 ， 应 用 程序 还 是 可 以 继续 访问 存储 在 原来 内 存 块 中 的 数 
据 ， 从 而 能 够 实现 一 个 干净 的 程序 终止 。 


72 文件 锁定 


文件 锁定 是 多 用 户 、 多 任务 操作 系统 中 一 个 非常 重要 的 组 成 部 
分 。 程 序 经 党 需要 共享 数据 ， 而 这 通 彰 是 通过 文件 来 实现 的 。 因 此 ， 
对 于 这 些 程序 来 说 ， 建 立 某 种 控制 文件 的 方式 惑 非常 重要 了 “。 只 有 这 
样 ， 文 件 才 可 以 通过 一 种 安全 的 方式 更 新 ， 或 者 说 ， 当 一 个 程序 正在 
对 文件 进行 写 操 作 时 ， 文 件 吏 会 进入 一 个 暂时 状态 ， 在 这 个 状态 下 ， 
o ERS BS BRS EIR TRA 

Linux 提 供 了 多 种 特性 来 实现 文件 锁定 。 其 中 最 简单 的 方法 就 是 以 
原子 操作 的 方式 创建 锁 文 件 ， 所 请 “原子 操作 ” 束 古 在 创建 锁 文 件 时 ， 
系统 将 不 允许 任何 其 他 的 事情 发 生 。 这 就 给 程序 提供 了 一 种 方式 来 确 
保 它 所 创建 的 文件 是 唯一 的 ， 而 且 这 个 文件 不 可 能 被 其 他 程序 在 同一 
时 刻 创建 。 

第 二 种 方法 更 高 级 一 些 ， 它 允许 程序 锁定 文件 的 一 部 分 ， 从 而 可 
以 独 吾 对 这 一 部 分 内 容 的 访问 。 有 两 种 不 同 的 方式 可 以 实现 第 二 种 形 
式 的 文件 锁定 。 我 们 将 只 对 其 中 的 一 种 做 详细 介绍 ， 因 为 两 种 方式 非 
党 相似 一 一 第 二 种 方式 只 不 过 是 程序 接口 稍微 不 同 而 已 。 


7.2.1 创建 锁 文 件 


许多 应 用 程序 只 需要 能 够 针对 某 个 资源 创建 一 个 锁 文 件 即 可 。 然 
后 ， 其 他 程序 就 可 以 通过 检查 这 个 文件 来 判断 它们 目 己 是 否 被 允许 访 
问 这 个 资源 。 

这 些 锁 文件 通常 都 被 放置 在 一 个 特定 位 置 ， 并 带 有 一 个 与 被 控制 
资源 相关 的 文件 名 。 例 如 ， 当 一 个 调制 解 调 器 正在 被 使 用 时 ，Linux 通 
常会 在 /Var/spool 目 录 下 创建 一 个 锁 文 件 。 

注意 ， 锁 文件 仅仅 只 是 充当 一 个 指示 妖 的 角色 ， 程 序 间 需要 通过 
相互 协作 来 使 用 它们 。 用 术语 来 说 ， 锁 文件 只 是 建议 锁 ， 而 不 是 强制 
锁 ， 在 后 者 中 ， 系 统 将 强制 锁 的 行为 。 

为 了 创建 一 个 用 作 锁 指示 器 的 文件 ， 你 可 以 使 用 在 fent1.h 头 文件 

(你 在 前 面 的 章节 中 见 过 这 个 文件 ) 中 定义 的 open 系 统 调 用 ， 并 带 上 
O_CREAT 和 O_EXCL 标 志 。 这 样 能 够 以 一 个 原子 操作 同时 完成 两 项 工 
VE: 确定 文件 不 存在 ， 然 后 创建 它 。 


X 验 创建 锁 文 件 
你 可 以 在 下 面 的 程序 lock1.c 中 看 到 锁 文 件 是 如 何 创建 的 : 


第 一 次 运行 这 个 程序 时 ， 它 的 输出 古 : 


lock1 


但 当 你 再 次 运行 这 个 程序 时 ， 它 的 输出 是 : 

实验 解析 

这 个 程序 调用 带 有 O_CREAT 和 O_EXCL 标 志 的 open 来 创建 文 
件 /tmp/LCK.test。 第 一 次 运行 程序 时 ， 由 于 文件 并 不 存在 ， 所 以 open 
调用 成 功 。 但 对 程序 的 后 续 调 用 失败 了 ， 因 为 文件 已 经 存在 了 。 如 果 
想 让 程序 再 次 执行 成 功 ， 你 必须 删除 那个 锁 文件 。 

至 少 在 Linux 系 统 中 ， 错 误 号 17 代 表 的 是 EEXIST， 这 个 错误 用 来 

表示 一 个 文件 已 存在 。 错 误 号 定义 在 头 文 件 errno.h 或 (更 常见 的 ) 它 
所 包含 的 头 文 件 中 。 在 本 例 中 ， 这 个 错误 号 实际 定义 在 头 文 
人 中 : 

这 是 一 GOT open p |O EXCL) 失败 的 错误 

如 条 一 个 程序 在 它 执行 时 ， 只 需 独 占 某 个 资源 一 段 很 短 的 时 间 
一 一 这 用 术语 来 说 ， 通 党 说 称 为 临 界 区 ， 它 台 需要 在 进入 临界 区 之 前 
使 用 open 系 统 调 用 创建 锁 文 件 ， 然 后 在 退出 临界 区 时 用 unlink 系 统 调用 
删除 该 锁 文 件 。 


你 可 以 通过 编写 一 个 示例 程序 并 同时 运行 它 的 两 份 副本 ， 来 演示 
程序 是 如 何 利 用 这 个 锁 机 制 来 协调 工作 的 。 你 将 用 到 在 第 4 章 中 见 过 的 
m ares 
J 数字 编写。 


X 验 协调 性 锁 文件 
(1) 下 面 是 测试 程序 lock2.c 的 源 代码 : 


(214€ 


(2) 临界 区 从 这 里 开始 : 


(3) 在 这 里 结束 : 


a 在 运行 这 个 程序 之 前 ， 你 应 该 先 用 下 面 的 命令 来 确保 锁 文 件 不 存 
E: 


$ rm -f /tmp/LCK.test2 
然后 用 下 面 这 个 命令 来 运行 这 个 程序 的 两 份 副本 : 
./lock2 & ./lock2 


这 个 命令 在 后 全 运行 lock2 的 一 份 副 本 ， 在 前 台 运 行 男 一 份 副本 。 
下 面 是 它 的 输出 结 


上 面 的 例子 显示 了 同一 个 程序 的 两 个 实例 是 如 何 协调 工作 的 。 当 
运行 这 个 例子 的 时 候 ， 你 几乎 肯定 会 看 到 与 上 述 输出 不 同 的 进程 标识 
符 ， 但 程序 的 行为 将 十 一 样 的 。 

实验 解析 


出 于 演示 目的 ， 你 使 用 while 语 句 让 程序 循环 10 次 。 这 个 程序 然后 
通过 创建 一 个 唯一 的 锁 文 件 /tmp/LCK.test2 来 访问 临界 资源 。 如 果 因 为 
文件 已 存在 而 失败 ， 程 序 将 等 候 一 小 段 时 间 后 再 次 笑 试 。 如 果 成 功 ， 
它 束 可 以 开始 访问 资源 。 在 标记 为 “临界 区 ”的 部 分 ， 你 可 以 执行 任何 
需要 独占 式 访问 的 处 理 。 

因为 这 只 是 一 个 演示 程序 ， 所 以 你 只 等 每 了 一 小 段 时 间 。 程 序 使 
用 完 资 源 后 ， 它 将 通过 删除 锁 文 件 来 释放 锁 。 然 后 它 可 以 在 重新 申请 
锁 之 前 执行 一 些 其 他 的 处 理 (本 例 中 只 是 调用 sleep 函 数 ) 。 这 里 锁 文 
件 扮 小 了 类 似 二 进 制 信号 量 的 角色 ， 束 问题 “我 可 以 使 用 这 个 资源 
吗 ? “给 每 个 程序 一 个 "是 "或 " 否 " 的 答案 。 你 将 在 第 14 重 进 一 此 学 习 信 
TES 


这 是 一 个 进程 间 协 调 性 的 安排 ， 你 必须 正确 地 编写 代码 以 使 
其 正常 工作 ， 意 识 到 这 一 点 是 非常 重要 的 。 当 程序 创建 锁 文件 失 
败 时 ， 它 不 能 通过 删除 文件 并 重新 尝试 的 方法 来 解决 此 问题 。 或 
许 这 样 做 可 以 让 它 创建 锁 文件 ， 但 男 一 个 创建 锁 文件 的 程序 将 无 
法 得 知 它 已 经 不 再 拥有 对 这 个 资源 的 独占 式 访问 权 了 。 


7.2.2 区域 锁定 


用 创建 锁 文件 的 方法 来 控制 对 诸如 串 行 口 或 不 经 和 常 访问 的 文件 之 
类 的 资源 的 独占 式 访问 ， 是 一 个 不 错 的 选择 ， 但 它 并 不 适用 于 访问 大 
型 的 共享 文件 。 假 设 你 有 一 个 大 文件 ， 它 由 一 个 程序 写 入 数据 ， 但 却 
由 许多 不 同 的 程序 同时 对 这 个 文件 进行 更 新 。 当 一 个 程序 负责 记录 长 
期 以 来 连续 收集 到 的 数据 ， 而 其 他 一 些 程序 负责 对 记录 的 数据 进行 处 
理 时 ， 这 种 情况 束 可 能 发 生 。 处 理 程序 不 能 等 待 记录 程序 结束 ， 因 为 
记录 程序 将 一 直 不 停 地 运行 ， 所 以 它们 需要 一 些 协调 方法 来 提供 对 同 
一 个 文件 的 并 发 访问 。 

你 可 以 通过 锁定 文件 区 域 的 方法 来 解决 这 个 问题 ， 文 件 中 的 某 个 
特定 部 分 被 锁定 了 ， 但 其 他 程序 可 以 访问 这 个 文件 中 的 其 他 部 分 。 这 
被 称 为 文件 段 锁定 或 文件 区 域 锁定 。Linux 提 供 了 至 少 两 种 方式 来 实现 
这 一 功能 : 使 用 fcnt1 系 统 调 用 和 使 用 lockf 调 用 。 我 们 将 主要 介绍 fcnt1 
接口 ， 因 为 它 是 最 常 使 用 的 接口 。lockf 和 fent1 非 常 相似 ， 在 Linux 中 ， 
它 一 般 作 为 fcnt1 的 备 选 接口 。 但 是 ，fcnt1 和 ]lockf 的 锁定 机 制 不 能 同时 
工作 : 它们 使 用 不 同 的 底层 实现 ， 因 此 决 不 要 混合 使 用 这 两 种 类 型 的 
调用 ， 而 应 坚持 使 用 其 中 的 一 种 。 

你 已 在 第 3 章 中 见 过 fcnt1 调 用 ， 它 的 定义 如 下 所 示 : 


@include «fcntl.h» 


fcnt1 对 一 个 打开 的 文件 描述 符 进 行 操作 ， 并 能 根据 command 参 数 
ee eee 。 它 为 我 们 提供 了 3 个 用 于 文件 锁定 的 命令 选 
Jit: 

O F GETLK 

O F_SETLK 

O F_SETLKW 

3 aS ey, fentl E — 1 2 30D EA ta [Al flock 
结构 的 指针 ， 所 以 实际 的 函数 原型 应 为 : 
int fcntl(int fildes, int command, struct flock *flock structure); 

flock 《文件 锁 ) 结构 依赖 具体 的 实现 ， 但 它 至 少 包 含 下 述 成 员 : 
short ] type 
short | whence 
off tl start 
off tl len 
pid tl pid 


口 口 口 口 口 


1L_type 成 员 的 取 值 定义 在 头 文 件 fcnt1.h 中 ， 如 表 7-1 所 示 。 
表 74 


Lu a 说 t 


LE EEO AER SEL 
ATRA, (HH (ics Pl NTC AIAX I E CE IELSS 
! m i ^ HN 


1_whence、1_start 和 ]1_len 成 员 定 义 了 文件 中 的 一 个 区 域 ， 即 一 个 连 
续 的 字 节 集合 。]_whence 的 取 值 必须 是 SEEK_ SET ^ SEEK. CUR ` 
SEEK END 《在 头 文件 unistdh 中 定义 ) 中 的 一 个 。 它 们 分 别 对 应 于 文 
件 头 、 当 前 位 置 和 文件 尾 。1_whence 定 义 了 1_start 的 相对 偏 移 值 ， 其 
FH. ] start 是 该 区 域 的 第 一 个 字 节 。1] whence 通 第 被 设 为 SEEK_SET,， 
这 时 1 _start 就 从 文件 的 开始 计算 。]_ len 参数 定义 了 该 区 域 的 字 节 数 。 

1_pid 参 数 用 来 记录 持 有 锁 的 进程 ， 参 见 下 面 对 F_GETLK 的 介绍 ° 

文件 中 的 每 个 字 节 在 任 一 时 刻 只 能 拥有 一 种 类 型 的 锁 : 共享 锁 、 
独占 锁 或 解锁 。fcnt1 调 用 可 用 的 命令 和 选项 的 组 合 相 当 多 ， 我 们 将 在 
下 面 依次 介绍 它们 。 

1. F_GETLK 命 令 

第 一 个 命令 是 F_GETLK。 它 用 于 获取 各 des (第 一 个 参数 ) 打开 
的 文件 的 锁 信 息 。 它 不 会 党 试 去 锁定 文件 。 调 用 进程 把 自己 想 创建 的 
锁 类 型 信息 传递 给 fcnt1， 使 用 F_GETLK 命 令 的 fcnt1 就 会 返回 将 会 阻止 
获取 锁 的 任何 信息 。 

flock 结 构 中 使 用 的 值 如 表 7-2 所 示 。 


表 7-2 


i4 


进程 可 能 使 用 F_GETLK 调 用 来 查看 文件 中 某 个 区 域 的 当前 锁 状 
态 。 它 应 该 设置 flock 结 构 来 表明 它 需 要 的 锁 类 型 ， 并 定义 它 感 兴 趣 的 
文件 区 域 。fcnt1 调 用 如 采 成 功 殉 返 回 非 -1 的 值 。 如 采 文 件 已 被 锁定 从 
而 阻止 锁 请 求 成 功 执行 ，fcnt1 会 用 相关 信息 才 关 flock 结 构 。 如 采 锁 请 


求 可 以 成 功 执行 ，flock 结 构 将 保持 不 变 。 如 果 F_GETLK 调 用 无 法 获得 
信息 ， 它 将 返回 -1 表明 失败 。 

如 果 F_GETLK 调 用 成 功 〈 例 如 ， 它 返回 一 个 非 -1 的 值 ) ， 调 用 程 
序 就 必须 检查 flock 结 构 的 内 容 来 判断 其 是 否 被 修改 过 。 因 为 L_pid 的 值 
被 设置 成 持 有 锁 的 进程 (如 果 有 的 话 ) 的 标识 符 ， 所 以 通过 检查 这 个 
字段 就 可 以 很 方便 地 判断 出 flock 结 构 是 否 被 修改 过 。 


2. FE_SETLK 命 令 


这 个 命令 试图 对 身 des 指 向 的 文件 的 某 个 区 域 加 锁 或 解锁 。flock 结 
构 中 使 用 的 值 (与 F_GETLK 命 令 中 用 到 的 不 同 之 处 ) 如 表 7-3 所 示 。 


X 7-3 


= Ss 


yy Wave hc QR DTE e was 
"UA LITT A 


£F GETLK — E, 2 U0 e mj pc 3s pH flock 24 $5 P B1 start ^ 
l whence 和 1] len 的 值 定 义 。 如 果 加 锁 成 功 ，fcnt1 将 返回 一 个 非 -1 的 
值 ， 如果 失 败 ， 则 返回 -1。 这 个 函数 总 是 立刻 返回 。 


3. F_SETLKW 命 令 


F SETLKW 命 令 与 上 面 介绍 的 F_SETLK 命 令 作 用 相同 ， 但 在 无 法 
获取 锁 时 ， 这 个 调用 将 等 待 直到 可 以 为 止 。 一 旦 这 个 调用 开始 等 待 ， 
SE ee eee e 我 们 将 在 第 11 章 讨 
论 信号 。 

程序 对 某 个 文件 拥有 的 所 有 锁 都 将 在 相应 的 文件 描述 符 被 关闭 时 
自动 清除 。 在 程序 结束 时 也 会 自动 清除 各 种 锁 。 


7.2.3 TuS FAVES 


当 对 文件 区 域 加 锁 之 后 ， 你 必须 使 用 底层 的 read 和 write 调用 来 访 
问 文件 中 的 数据 ， 而 不 要 使 用 更 高 级 的 fread 和 fwrite 调 用 ， 这 是 因为 
fread 和 fwrite 会 对 读 写 的 数据 进行 缓存 ， 所 以 执行 一 次 fread 调 用 来 读 取 
文件 中 的 头 100 个 字 节 可 能 (事实 上 ， 是 几乎 肯定 如 此 ) 会 读 取 超过 
100 个 字 厄 的 数据 ， 并 将 多 余 的 数据 在 函数 库 中 进行 缓存 。 如 果 程序 再 
次 使 用 fread 来 读 取 下 100 个 字 太 的 数据 ， 它 实际 上 将 读 取 已 缓冲 在 函 


eee 而 不 会 引发 一 个 底层 的 read 调 用 来 从 文件 中 取出 更 多 
YSZ o 

为 了 说 明 这 为 什么 是 一 个 问题 ， 让 我 们 来 考虑 这 样 一 个 例子 : PN 
个 程序 都 打算 更 新 同一 个 文件 。 假 设 这 个 文件 由 200 个 全 为 零 的 字 节 组 
成 。 第 一 个 程序 先 开 始 运 行 ， 并 获得 该 文件 头 100 个 字 节 的 写 锁 。 它 然 
后 使 用 fread 来 读 取 这 100 个 字 节 。 但 是 正如 我 们 在 前 面 章节 中 所 看 到 
的 ，fread 会 一 次 读 取 多 达 BUFSIZ 个 字 节 的 数据 ， 因 此 ， 它 实际 上 把 整 
个 文件 都 读 到 了 内 存 中 ， 但 仅 把 头 100 个 字 节 传递 给 程序 。 

接着 ， 第 二 个 程序 开始 运行 。 它 获得 了 文件 后 100 个 字 节 的 写 锁 。 
这 个 操作 将 会 成 功 ， 因 为 第 一 个 程序 只 锁定 了 文件 的 前 100 个 字 节 。 人 第 

二 个 程序 将 100~199 字 的 数据 都 写成 2， 关 闭 文 件 并 解锁 ， 最 后 退出 

程序 。 这 时 ， 第 一 个 程序 锁定 了 文件 的 后 100 个 字 节 ， 然 后 调用 fread 
来 读 取 数据 。 尺 管 真正 存在 于 文件 中 的 数据 是 100 个 字 广 的 2， 但 是 因 
为 先前 数据 已 经 被 缓存 ， 所 以 程序 实际 上 读 到 的 数据 将 是 100 个 字 节 的 
零 。 但 如 果 你 使 用 read 和 write， 这 个 问题 惑 不 会 发 生 。 

上 述 关 于 文件 锁 的 描述 看 起 来 似乎 很 复杂 ， 但 实际 上 是 说 起 来 
难 ， 做 起 来 反而 要 容易 一 些 。 


X 验 使 用 fcnt1 锁 定 文件 
下 面 ， 我 们 通过 示例 程序 lock3.c 来 看 文件 锁定 是 如 何 工作 的 。 为 
了 试验 锁定 ， 你 需要 两 个 程序 ， 一 个 用 来 锁定 而 另外 一 个 进行 测试 。 
第 一 个 程序 完成 锁定 。 
(1) 程序 从 包含 头 文件 和 变量 声明 开始 : 


(2) 打开 一 个 文件 描述 符 . 


(3) 给 文件 添加 一 些 数 据 : 


(4) 


TU X FH 10~30F TIX A Kil, FER LBS M: 


(5) 把 文件 的 40~50 字 节 设 为 区 域 2， 并 在 其 上 设置 独占 锁 ; 


(6) 现在 锁定 文件 : 


fprint 
fprintf 


(7) 然后 等 一 会 儿 : 


实验 解析 

程序 首先 创建 一 个 文件 ， 并 以 可 读 可 写 方式 打开 它 ， 然 后 再 在 文 
件 中 添加 一 些 数据 。 接 着 在 文件 中 设置 两 个 区 域 ， 第 一 个 区 域 为 10~ 
207, HAS QE) 锁 ， 第 二 个 区 域 为 40~~50 字 节 ， 使 用 独占 
(Ej) 锁 。 然 后 程序 调用 fcnt1 来 锁定 这 两 个 区 域 ， 并 在 关闭 文件 和 退 
出 程序 前 等 待 一 分 钟 。 

图 7-1 显 示 了 当 程 序 开 始 等 每 时 文件 锁定 的 状态 。 


gu CO nee a eee ena 
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实 验 测试 文件 上 的 锁 


在 本 例 中 ， 你 将 编写 一 个 程序 来 测试 可 能 会 用 在 文件 不 同 区 域 上 
的 各 种 类 型 的 锁 。 


(1) 与 往常 一 样 ， 程 序 从 包含 头 文件 和 声明 变量 开始 : 


Tak: 


(2) 打开 一 个 文件 描述 符 : 


file desc = open{test_file, O_RDWR | O CREAT, 0656): 

if (!file desc) | 
fprintfistderr, "Unable to open ts for read/write’, test file]: 
exit [EXIT_FAILURE] ; 

) 


for (start byte = 0; start byte < 99: start byte += SIZE TO TRY) ( 


(3) 设置 希望 测试 的 文件 区 域 : 


region_totest.l_ type = F.WRLCK; 
region to test.l whence = SEEX SET; 
region to .tegt.l start = start byte; 
region to .test.l len = SIZH TO TRY; 
region to .test.l.pid = -1i 


printf('Testing F WRLCK on region from td to *din', 
start byte, start byte + SITE TO TRY!; 


(4) 现在 测试 文件 上 的 锁 : 


res = fcntli|file desc, F GETLK, région to test]; 
if [res == -1) { 
fprintf(stderr, *F_GETLK failed'in*!; 
exit(EXIT FAILURE!; 
) 
if [region to test.1 pid fw -1) { 
printfi*"Lock would fail. F OETLK returned: in*!; 
show lock info(&region to test); 


} 
eise [ 


printf ("F WRECK = Lock would succeedin*); 
} 


(5) 用 共享 (E) 锁 重 复 测 试 一次， 再 次 设置 希望 测试 的 文件 区 


region .to test.l type = F RDLCK; 

region to tegt.l whence = SEEK SET; 

region to test.] start » start byte; 

region to test.l len = SIZE TO TRY; 

region to test.l pid = -1; 

printfi*Testing F RDLCKX on region from td to bdin", 
start byte, start byte + SIZE TO TY]; 


(6) 再 次 测试 文件 上 的 锁 : 


Ay qp ume FRB IST AE lock3, AS iB lock45k ill 
pee 通过 在 后 台 运 行程 序 lock3 来 达到 这 个 目的 ， 下 面 是 执行 
J ng : 


lock3 & 


命 命令 提示 符 又 出 现 了 ， 这 是 因为 lock3 是 在 后 台 运 行 的 ， 紧 接着 你 
用 下 面 的 命令 来 运行 程序 lock4: 


lock4 


TEER, ATE REIL, TER ANA EE 


实验 解析 

lock4 程 序 把 文件 中 的 每 5 个 字 市 分 成 一 组 ， 为 每 个 组 设置 一 个 区 
域 结构 来 测试 锁 ， 然 后 通过 使 用 这 些 结构 来 判断 对 应 区 域 是 否 可 以 被 
加 写 锁 或 读 锁 。 返 回信 息 将 显示 造成 锁 请 求 失 败 的 区 域 字 节 数 和 从 字 
廊 0 开 始 的 偏 移 量 。 因 为 返回 结构 中 的 ]_pid 元 素 包 含 当 前 拥有 文件 锁 
的 程序 的 进程 标识 符 ， 所 以 程序 先 把 它 设 置 为 -1 〈 一 个 无 效 值 ) ， 然 
后 在 fent1 调 用 返回 后 检测 其 值 是 否 被 修改 过 。 如 果 该 区 域 当 前 未 被 锁 
定 ，1_pid 的 值 就 不 会 被 改变 。 

为 了 理解 程序 输出 的 含义 ， 你 需要 得 看 程序 中 包含 的 头 文件 
fcntl.h (通常 是 /usr/include/fent1.h) , ]L_type 的 值 为 1 对 应 的 定义 为 
F_WRLCK, 1_type 的 值 为 0 对 应 的 定义 为 F_RDLCK。 因 此 ，1_type 的 值 
为 1 表明 锁 失 败 的 原因 是 已 经 存在 一 个 写 锁 了 ， 而 1]_type 的 值 为 0 是 因为 
已 经 存在 一 个 读 锁 了 。 在 文件 中 未 被 lock3 程 序 锁定 的 区 域 上 ， 无 论 是 
共享 锁 还 是 独占 锁 都 将 会 成 功 。 

你 可 以 看 到 10~30 字 节 上 可 以 设置 一 个 共享 锁 ， 因 为 程序 lock3 在 
该 区 域 上 设置 的 是 共享 锁 而 不 是 独占 锁 。 而 在 40~50 字 广 的 区 域 上 ， 
两 种 锁 都 将 失败 ， 因 为 lock3 已 经 在 该 区 域 上 设置 了 一 个 独占 

(F_WRLCK) 锁 。 

当 程 序 lock4 执 行 结束 后 ， 你 需要 等 符 一 小 段 时 间 让 程序 lock3 完 成 

它 的 sleep 调 用 并 退出 。 


7.2.4 ye 


现在 你 已 知道 如 何 测试 一 个 文件 上 的 已 有 锁 ， 下 面 让 我 们 来 看 看 
当 两 个 程序 争夺 文件 同一 区 域 上 的 锁 时 会 发 生 什么 情况 。 你 将 再 次 用 
lock3 程 序 来 锁定 文件 ， 然 后 用 一 个 新 的 程序 lock5 来 竹 试 对 它 进行 加 
nn 
TUR o 


X 验 文件 锁 的 竞争 

下 面 的 程序 lock5.c 的 作用 不 再 是 测试 文件 中 不 同 部 分 的 锁 状 态 ， 
而 是 试图 对 文件 中 已 经 被 锁定 的 区 域 再 次 加 锁 。 

(1) 在 ##include 语 句 和 变量 声明 之 后 ， 打 开 一 个 文件 描述 符 : 


file desc pen[test file, O_RDW CREAT, 0566}: 
(ifile dz 


(2) 程序 的 其 余部 分 指定 文件 的 不 同 区 域 ， 并 尝试 在 它们 之 上 执 
行 不 同 的 锁定 操作 : 


J 


zos + fcntlifile desc, P SETLK, tregion_to_lock): 
if (ees == -1) | 
printt(*Procene t4 - failed to umlock regionin*, getpid(lli 
) eise ( 
printf['Process Wd - unlocked regicoin'. getpidil]! 
) 


region to lock.1 type = P UNLCK: 
tegion to lock.l whence = SEEX 3ET; 
region to lock.1 start = 6; 
region co lock.l.iem » 50; 
printfi*Procesa Wd, trying F.UNLCK, regico td to Wiio*, getpidil. 
fint]region to lock.1 start, 
(int) (region tc lock,i start + 
regicn to lock.1 len)]: 
tes = fecntlifile desc, P.SETLK, &region to, lock); 
if (res == +h) ( 
printf(*Process td - failed to unlock regica\n*, getpidi]!: 
) eise | 
printf(*Proceas 44 - unlocked regien\n’. getpidill! 
) 


region to lock.l type = F WRLCK; 
region to lock.l whence = SEEK IET; 
region to lock.l start = 16; 
region to leck.l lem » $; 
printfi*Process td, trying F.WRLCK, region Wi to d\n’, getpidi), 
lint) region to lock.] atart, 
{int} (region to lock.1 start + 
region to lock.1 len]); 
res + fcatl(file desc, F BETLK. &regiony to, lock] 
if (res ee +1) { 
printfi'Procems td - failed to lock regionin*, getpidi)): 
) else ( 
printfi'Process 44 ~ obtained lock om regice|n*, getpid[l); 


region to lock.l type + FACE: 
region to lock.l whence = SERK SET; 
region to lock.2 start e 40; 
zegion to loóck.1.len = 16; 
print! (‘Process $6, trying F RDLCK, regica Wd to "din*, getpidi), 
lint]regicn to lock.1 start. 
lánt!!region to lock.l start + 
region to lock.i leni]; 
ses + fontlifile desc, F_SETLE, &region so lock]; 
if ires «= -1) [ 
printf (*Process td - failed to lock regionin". cetpidt))r 
} eise | 
printf|'Prccess Wd ~ obtained lock on regionin*, getpid(]: 


region to lock.1l type «= 7 MRLCK; 
region to lock.] whence * SEEK SET! 


region to lock.l start = 16; 
region to lock.l len = 5; 
printf("Process Wd, trying F.WRLCK with wait, region tå to Wdin*, getpidl), 
tint)region to lock.l start, 
línt]iregion to lock.l start + 
region to lock.l len]); 
res = fcntli|file desc, P SETLEW, &region to lock); 
if (res == -1) ( 
printfi*Process td - failed to lock regiocnin*, getpid{)): 
] eise | 
printf('Process Wd = obtained lock on regicnin", getpid(]): 
J 


printf(*Process td ending\n*, getpidi)]: 
close (file desc]: 
exit (EXIT. SUCCESS) | 


如 膝 首先 在 后 台 运 行 lock3 程 序 ， 然 后 立刻 运行 这 个 新 程序 : 


5 ./lock3 & 
locks 


你 得 到 的 输出 如 下 所 示 : 


实验 解析 

首先 ， 这 个 程序 尝试 用 共享 锁 来 锁定 文件 中 10~15 字 节 的 区 域 。 
SALMER PCIE, OLEAN GRRL, MCN 
Ihe 
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这 个 程序 试图 解除 这 个 文件 前 50 字 下 上 的 锁 ， 昌 然 它 实际 上 并 未 对 这 
块 区 域 进行 锁定 ， 但 这 也 成 功 了 ， 因 为 虽然 这 个 程序 并 未 对 这 个 区 域 
加 锁 ， 但 解锁 请 求 最 终 的 结 采 取决 于 这 个 程序 在 文件 的 头 50 个 字 世 上 
并 没有 设置 任何 锁 。 

这 个 程序 接 下 来 试图 用 一 把 独占 锁 来 锁定 文件 中 16~21 子 市 的 区 
域 。 由 于 这 块 区 域 上 已 经 有 了 一 个 共 至 锁 ， 独 占 锁 无 法 创建 ， 所 以 这 
个 锁定 操作 失败 了 。 

然后 ， 程 序 义 尝试 用 一 把 共 至 锁 来 锁定 文件 中 40~50 字 市 的 区 
A es ee ease 


最 后 ， 程 序 再 次 党 试 在 文件 中 16~21 字 节 的 区 域 上 获得 一 把 独占 
锁 ， 但 这 次 它 用 F_SETLKW 命 令 来 等 待 直到 它 可 以 获得 一 把 锁 为 止 。 
于 是 程序 的 输出 就 会 遇 到 一 个 很 长 的 停顿 ， 直 到 已 锁 住 这 块 区 域 的 
lock3 程 序 因 为 完成 sleep 调 用、 关闭 文件 而 释放 了 它 先 前 获得 的 所 有 锁 
为 止 。lock5 程 序 继续 执行 ， 成 功 锁定 了 这 块 区 域 ， 最 后 它 也 退出 了 运 
行 。 


7.2.5 命 


_ 还 有 另外 一 种 锁定 文件 的 方法 : lockf 函 数 。 它 也 通过 文件 描述 符 
进行 操作 。 其 原型 为 : 


int lockf{int fildes, int function, off_t size to lock); 


function 参 数 的 取 值 如 下 所 示 。 

O F_ULOCK: 解 锁 。 

O F_LOCK: 设 置 独 占 锁 。 

O F_TLOCK: 测 试 并 设置 独占 锁 。 

O F_TEST: 测 试 其 他 进程 设置 的 锁 。 
" size to lock ÆRET PAX, EMAER A Bil fme (B7T TT 

lockf 有 一 个 比 fcnt1 函 数 更 简单 的 接口 ， 这 主要 是 因为 它 在 功能 性 
和 灵活 性 上 都 要 比 fcnt1 函 数 差 一 些 。 为 了 使 用 这 个 函数 ， 必 须 首 先 搜 
寻 你 想 锁定 的 区 域 的 起 始 位 置 ， 然后 以 要 锁定 的 字 节 数 为 参数 来 调用 
已 o 


与 文件 锁定 的 fcntl 方 法 一 样 ，lockf 设 置 的 所 有 锁 都 是 建议 锁 ， 它 
们 并 不 会 真正 地 阻止 你 读 写 文件 中 的 数据 。 对 锁 的 检测 是 程序 的 贡 
任 。 混 合 使 用 fcnt1 锁 和 lockf 锁 的 效果 未 被 定义 ， 因 此 你 必须 决定 使 用 
哪 种 类 型 的 锁定 方法 并 坚持 用 下 去 。 


7.2.6 ^t 
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完整 的 。 假 设 两 个 程序 想 要 更 新 同一 个 文件 。 它 们 需要 同时 更 新 文件 
中 的 字 节 1 和 字 忆 2。 程 序 A 选 择 首 先 更 新 字 有 2， 然 后 再 更 新 字 节 1。 
程序 B 则 是 先 更 新 字 节 1， 然 后 才 是 字 节 2 。 

两 个 程序 同时 启动。 程序 A 锁 定 字 节 2， 而 程序 B 锁 定 字 节 1。 然 后 
程序 A 党 试 锁定 字 忆 1， 但 因为 这 个 字 节 已 经 被 程序 B 锁 定 ， 所 以 程序 
A 将 在 那里 等 待 。 接 着 程序 B 演 试 锁定 字 节 2， 但 因为 这 个 字 节 已 经 被 
程序 A 锁定 ， 所 以 程序 B 也 将 在 那里 等 得 。 

这 种 两 个 程序 都 无 法 继续 执行 下 去 的 情况 ， 束 被 称 为 死 锁 

(deadlock 或 deadly embrace) 。 这 个 问题 在 数据 库 应 用 程序 中 很 常 
见 ， 当 许多 用 户 频 党 访问 同一 个 数据 时 职 很 容易 发 生死 锁 。 大 多 数 的 
商业 关系 型 数据 库 都 能 够 检测 到 和 死 锁 并 目 动 解 开 ， 但 Linux 内 核 不 行 。 
这 时 就 需要 采取 一 些 外 部 干涉 手段 ， 例 如 强制 终止 其 中 一 个 程序 来 解 
决 这 个 问题 。 


程序 员 必 须 对 这 种 情况 提高 警惕 。 当 有 多 个 程序 都 在 等 待 获得 锁 
时 ， 你 就 需要 非常 小 心地 考虑 是 否 会 发 生死 锁 。 在 本 例 中 ， 和 死 锁 是 非 
HEAD MEST: 两 个 程序 只 需要 使 用 相同 的 顺序 来 锁定 它们 需要 的 字 
世 或 锁定 一 个 更 大 的 区 域 即 可 。 


在 这 里 ， 我 们 没有 足够 的 篇 幅 来 讲解 开发 并 发 程序 的 原理 。 
URRA NXB TELZ, W A H Principles of Concurrent and 
Distributed Programming (《 并 发 和 分 布 式 程序 设计 原理 》， 
M.Ben-Ari, Prentice Hall, 1990) 


7.3 数据库 


你 已 经 看 到 如 何 使 用 文件 来 储存 数据 ， 那 么 为 什么 还 要 用 数据 库 
We? 非常 简单 ， 因 为 在 有 些 情况 下 ， 数 据 库 的 特性 提供 了 解决 问题 的 
。 与 使 用 文件 来 存储 数据 相 比 ， 使 用 数据 库 有 如 下 两 方面 的 
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O 你 可 以 存储 长 度 可 变 的 数据 记录 ， 这 对 平面 的 、 非 结构 化 的 
文件 来 说 实现 起 来 有 点 困难 。 

O 数据 库 使 用 索引 来 有 效 地 存储 和 检索 数据 。 这 样 做 的 一 个 显 
着 优点 十 这 个 索引 不 必 非 得 古 一 个 简单 的 记录 号 一 一 这 在 平面 文 
件 中 很 容易 实现 ， 它 可 以 是 一 个 任意 的 字符 串 。 


7.3.1 dbm 数 据 库 


所 有 版 本 的 Linux 以 及 大 多 数 的 UNIX 版 本 都 随 系统 带 有 一 个 基本 
的 、 但 却 非常 高 效 的 数据 存储 例 程 集 ， 它 被 称 为 dbm 数 据 库 。dbm 数 
据 库 适 合 于 存储 相对 比较 静态 的 索引 化 数据 。 一 些 数 据 库 纯 粹 主义 者 
可 能 会 认为 dbm 根 本 算 不 上 是 一 个 数据 库 ， 充 其 量 就 是 一 个 索引 化 的 
文件 存储 系统 。 但 X/Open 规 范 把 dbm 看 作 是 一 个 数据 库 ， 因 此 在 本 书 
里 我 们 也 会 这 么 称呼 它 。 


1. dbm 简 介 


尽管 一 些 免 费 的 关系 型 数据 库 ， 如 MySQL 和 PostgreSQL 使 用 越 来 
越 广 泛 ，dbm 数 据 库 仍 然 在 Linux 中 扮演 着 一 个 重要 的 角色 。 那 些 使 用 
RPM 的 Linux 发 行 版 本 ， 如 RedHat 和 SUSE， 就 是 用 dbm 来 储存 已 安装 
软件 包 的 信息 。LDAP 的 开源 实现 OpenLDAP 也 可 以 使 用 dbm 作 为 它 的 
储存 机 制 。 与 更 加 完整 的 数据 库 产 品 如 MySQL 相 比 ，dbm 的 优势 在 于 
它 是 一 个 很 轻 量 级 的 软件 ， 而 且 它 非常 容易 被 编译 进 一 个 可 发 布 的 二 
进 制 文件 中 ， 因 为 它 无 需 安装 独立 的 数据 库 服务 器 。 在 写作 本 书 的 时 
候 ，Sendmail 和 Apache 都 在 使 用 dbm 数 据 库 。 

dbm 数 据 库 可 以 使 用 索引 来 存储 可 变 长 的 数据 结构 ， 然 后 通过 索 
引 或 顺序 扫描 数据 库 来 检索 结构 。dbm 数 据 库 适用 于 处 理 那些 被 频繁 
zu. E ene ， 因 为 它 创建 数据 项 时 非常 慢 ， 而 检索 时 
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讲 到 这 里 ， 我 们 遇 到 了 一 个 小 问题 : 多 年 以 来 ，dbm 数 据 库存 在 
着 各 种 不 同 的 版 本 ， 它 们 的 API 接 口 和 特性 都 有 一 些 细微 的 差别 。 婚 
有 最 初 的 dbm 集 ， 又 有 “新 ”的 被 称 为 ndbm 的 dbm 集 ， 还 有 GNU 的 dbm 
实现 gdbm。GNU 的 实现 版 本 虽然 可 以 模拟 旧版 本 的 dbm 和 ndbm 接 口 ， 
但 其 本 身 的 接口 和 其 他 实现 版 本 相 比 ， 还 是 有 着 显著 的 不 同 。 不 同 的 
Linux 发 行 版 本 自 带 的 dbm 库 也 不 一 样 ， 虽 然 最 常见 的 选择 是 融 有 gdbm 
库 ， 因 为 它 可 以 模拟 其 他 两 种 接口 类 型 。 

在 这 里 ， 我 们 将 重点 介绍 hdbm 接 口 ， 因 为 它 已 由 X/Open 组 织 标准 
化 ， 并 且 它 的 使 用 要 比 原始 的 gdbm 实 现 人 简单 一 些 。 


2 .获得 dbm 


大 多 数 主流 的 Linux 发 行 版 都 会 默认 安装 gdbm， 但 在 一 些 发 行 版 
中 ， 你 可 能 需要 使 用 软件 包 管 理 器 来 安装 相应 的 开发 库 。 例 如 ， 在 
Ubuntu 中 ， 你 可 能 需要 使 用 Synaptic 软 件 包 管理 器 来 安装 libgdbm-dev 
软件 包 ， 因 为 它 一 般 不 会 被 默认 安装 。 

如 有 果 想 要 查看 gdbm 开 发 包 的 源 代码 ， 或 者 使 用 的 Linux 发 行 版 没 
有 提供 预 编译 的 gdm 开发 包 ， 你 可 以 在 网 址 
www.gnu.org/software/gdbm/gdbm.html 上 找到 dbm 的 GNU 实 现 gdbm ° 


3. 故障 解决 和 重 装 dbm 


本 章 假设 你 已 安装 了 dbm 的 GNU 实 现 gdbm 和 ndbm 兼 容 库 。Linux 
发 行 版 通 冲 都 已 这 么 做 了 ， 但 如 前 所 述 ， 你 可 能 必须 明确 安装 开发 库 
软件 包 以 编译 使 用 ndbm 例 程 的 文件 。 
遗憾 的 是 ， 对 于 不 同 的 Linux 发 行 版 ， 编 译 使 用 ndbm 麻 的 源 文件 
所 需 的 包含 库 和 链接 库 略 有 不 同 ， 所 以 ， 虽 然 你 已 安装 了 gdbm 和 
ndbm 兼 容 库 ， 但 你 可 能 还 需要 经 过 实验 来 发 现 如 何 编译 这 些 源 文 件 。 
最 常见 的 情况 是 ， 系 统 已 安装 了 gdbm， 并 且 它 在 默认 情况 下 就 支持 了 
ndbm 兼 容 模 式 ，Red Hat 发 行 版 就 是 这 样 的 。 在 这 种 情况 下 ， 你 需要 
执行 如 下 操作 。 
(1) 在 C 源 文件 中 包含 头 文件 ndbm.h 。 
(2) 使 用 编译 行 选项 -lusr/include/gdbm 包含 头 文件 目 
>/usr/include/gdbm ° 
(3) 使 用 编译 行 选项 -jgdbm 链 接 gdbm 库 。 
如 果 这 不 起 作用 ， 一 种 常见 的 选择 〈 也 是 最 近 的 Ubuntu 和 SUSE 发 
行 版 使 用 的 方法 ) 是 : 系统 已 安装 了 gdbm， 但 在 需要 ndbm 兼 容 模式 


时 ， 你 必须 明确 地 指定 它 ， 并 且 你 可 能 需要 在 链接 主 函数 库 之 前 链接 
兼容 库 。 你 需要 做 的 具体 操作 如 下 所 示 。 

(1) 在 C 源 文件 中 包含 头 文件 gdbm-ndbm.h 而 不 是 ndbm.h 。 

(2) 使 用 编译 行 选项 -Lusr/include/gdbm 包含 头 文件 目 
录 /usr/include/gdbm 

(3) 使 用 编译 行 选项 -lgdbm_compat-lgdbm 链 接 其 他 的 gdbm 兼 容 
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可 下 载 的 Makefile 文 件 和 dbm C 源 文件 都 被 默认 设置 为 使 用 第 一 种 
选择 ， 但 它们 都 包含 注释 以 说 明 如 何 可 以 通过 编辑 方便 地 切换 到 使 用 
第 二 种 选择 。 在 本 章 的 剩余 部 分 ， 我 们 将 假设 你 的 系统 默认 整 支 持 
ndbm 兼 容 模 式 。 


7.3.7 ”dbm 例 程 


和 我 们 在 第 6 章 中 讨论 的 curses 函 数 库 一 样 ，dbm 也 是 由 头 文 件 和 
库 文 件 组 成 ， 而 且 库 文 件 必 须 在 程序 被 编译 时 链接 进来 。 库 文件 被 简 
称 为 dbm， 但 因为 我 们 通常 在 Linux 中 使 用 的 是 GNU 的 dbm 实 现 ， 所 以 
我 们 需要 在 编译 行 中 使 用 选项 -ljgdbm 来 链接 这 个 实现 。 其 头 文件 是 
ndbm.h ° 

TE JT Ua REET dbm ER ZZ. BY, VR 201 HH A dbm 2x Hi FE Be P (BT 
么 ， 这 一 点 很 重要 。 一 旦 明白 了 这 个 ， 你 就 能 更 好 地 理解 该 如 何 使 用 
dbmi ži ° 
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索 数 据 时 用 作 关 键 字 的 数据 块 。 每 个 dbm 数 据 库 必 须 针 对 每 个 要 存储 
的 数据 块 有 一 个 唯一 的 关键 字 。 关 键 字 的 取 值 被 用 作 存 储 数 据 的 索 
引 。dbm 对 于 关键 字 和 数据 没有 限制 ， 对 使 用 超 长 关键 字 和 数据 的 情 
况 也 未 定义 任何 错误 。 规 范 允 许 具 体 实 现 把 关键 字 / 数 据 对 的 长 度 限 制 
为 1 023 个 字 节 ， 但 具体 实现 通常 不 会 进行 限制 ， 这 是 因为 具体 实现 往 
往 要 比 技术 规范 所 要 求 的 更 灵活 。 

为 了 操纵 这 些 数据 块 ， 头 文件 ndbm.h 定 义 了 一 个 名 为 datum 的 新 数 
。 该 类 型 确切 的 内 容 依赖 于 具体 实现 ， 但 它 至 少 包 含 下 面 两 个 

bi: 

void *dptr; 

size t dsize 

datum 是 一 个 用 typedef 语 句 定义 的 类 型 。 在 ndbm.h 文 件 中 还 为 dbm 
声明 了 一 个 类 型 定义 ， 它 是 一 个 用 来 访问 数据 库 的 结构 ， 其 作用 和 用 


来 访问 文件 的 FILE 结 构 很 相似 。dbm 类 型 定义 的 内 部 结构 依赖 于 具体 
实现 ， 它 决 不 允许 被 直接 使 用 。 

在 使 用 dbm 库 时 ， 如 有 宁 要 引用 一 个 数据 块 ， 你 必须 声明 一 个 datum 
类 型 的 变量 ， 将 成 员 dptr 指 向 数据 的 起 始点， uU Ld 
数据 的 长 度 。 无 论 古 每 存储 的 数据 或 是 用 来 访问 它 的 索引 都 总 是 通过 
这 个 datum 类 型 来 引用 。 

你 最 好 将 dbm 类 型 看 作为 类 似 于 FILE 的 类 型 。 当 打开 一 个 dbm 数 
据 库 时 ， 通 常会 创建 两 个 物理 文件 ， 它 们 的 后 缀 分 别 是 .pag 和 .dir， 并 
返回 一 个 dbm 指 针 ， 它 被 用 来 访问 这 两 个 文件 。 这 两 个 文件 决 不 应 该 
被 直接 读 写 ， 对 它们 的 访问 只 能 通过 dbm 例 程 来 进行 。 


在 一 些 实现 中 ， 这 两 个 文件 被 合并 到 一 起 ， 打 开 数 据 库 只 会 
创建 一 个 文件 。 


如 宁 对 SQL 数据 库 很 熟悉 ， 你 会 发 现 dbm 数 据 库 没 有 与 之 关联 的 
表格 或 列 结构 。 这 些 结构 对 于 dbm 数 据 库 来 说 并 不 是 必需 的 ， 因 为 
dbm 不 仅 对 每 存储 的 每 个 数据 项 没有 固定 长 度 的 要 求 ， 而 且 对 数据 的 
ea ° dbm 数 据 库 工 作 在 非 结构 化 的 二 进 制 数 据 块 基础 


7.3.3» dbm iK A 


现在 我 们 已 介绍 了 dbm 库 工作 的 基础 ， 下 面 我 们 可 以 来 具体 看 看 
E FERRIE AA 2 主要 的 dbm 画 数 的 原 型 如 下 所 示 : 


#include <ndbm.h> 
DBM *dbm open(const char *file , int file open ags il 1 
int dbm sto anm *da Bo se doe nai datum key, datum content, int store mode) 
datum dbm tik ch(DBM xis taba oe tor, datum k 
oid dbm close(DBM *databa scr uidet or); 


1. dbm_open iK ži 


这 个 函数 用 来 打开 已 有 的 数据 库 ， 也 可 以 用 来 创建 新 数据 库 。 
Hm 文件 名 ， 它 不 包含 .dir 或 .pag 后 缀 。 
余 的 参数 和 第 3 章 中 的 open 函 数 的 第 二 个 和 第 三 个 参数 一 样 。 你 
a RR deett Y o 第 二 个 参数 控制 数据 库 的 读 、 写 或 读 / 写 
权限 。 NES 必须 与 O_CREAT 进 行 二 
eee 参数 指定 将 被 创建 的 文件 的 初始 权 


dbm_open 返 回 一 个 指向 DBM 类 型 的 指针 。 它 被 用 于 所 有 后 续 对 数 
据 库 的 访问 。 如 有 果 和 失败 ， 它 将 返回 (DBM *) 0° 


2. dbm_storeRA 


你 用 这 个 函数 把 数据 存储 到 数据 库 中 。 如 前 所 述 ， 所 有 数据 在 存 
储 时 都 必须 有 一 个 唯一 的 索引 。 为 了 定义 你 想 要 存储 的 数据 和 用 来 引 
用 它 的 索引 ， 你 必须 设置 两 个 datum 类 型 的 参数 : 一 个 用 于 引用 索引 ， 
一 个 用 于 实际 数据 。 最 后 一 个 参数 store_mode 用 于 控制 当 试 图 以 一 个 
已 有 的 关键 字 来 存储 数据 时 会 发 生 的 情况 。 如 果 它 被 设置 为 
dbm_insert， 存 储 操 作 将 失败 并 且 dbm_store 返 回 1。 如 果 它 被 设置 为 
dbm_replace， 则 新 数据 将 覆盖 已 有 数据 并 且 dbm_store 返 回 0。 当 发 生 
其 他 销 误 时 ，dbm_store 将 返回 一 个 负 值 。 


3. dbm fetchER2X 


dbm fetch 函数 用 于 从 数据 库 中 检索 数据 。 它 使 用 一 个 先前 
dbm_open 调 用 返回 的 指针 和 一 个 指 同 关 键 字 的 datum 类 型 结构 作为 其 
参数 。 它 返回 一 个 datum 类 型 的 结构 。 如 果 在 数据 库 中 找到 与 这 个 关键 
字 关 联 的 数据 ， 返 回 的 datum 结 构 的 dptr 和 dsize 成 员 的 值 将 被 设 为 相应 
数据 的 值 。 如 果 没 有 找到 关键 字 ，dptr 将 被 设置 为 null。 


要 记 住 的 是 ，dbm_fetch 返 回 的 datum 类 型 结构 中 仅仅 包含 一 
个 指向 数据 的 指针 。 实 际 数据 依然 保存 在 dbm 库 的 本 地 存储 空间 
i 。 你 在 继续 调用 dbm 函 数 前 ， 必 须 把 数据 复制 到 程序 的 变量 中 

行 o 


4. dbm closeER2X 


ik ^ Ex BX X B] Hd dbm. open 1T FF B Z4 28 FE 9. "E B 8 CX FE Bl 
dbm_open 调 用 返回 的 dbm 指 针 。 


X 验 一 个 简单 的 dbm 数 据 库 
在 学 习 了 dbm 数 据 库 的 基本 函数 之 后 ， 你 可 以 开始 编写 第 一 个 
| 在 这 个 程序 中 ， 你 将 使 用 一 个 名 为 test_data 的 结 


(1) ÆFA UR UD ae #includei® 8] ` #define X ` mainEK BAL 
test data ig 的 声明 : 


miata. 
' tdlib.! 
ti 2.5 
3 1 
a de u 
some 
"include «gd = 
, lud ] 
"define 1 
tdefine M 
x " 
mi are 
1 uy. ge 
T ^ 
n m n 


(2) 在 main 函 数 中 ， 设 置 了 items to_store 和 items_received 两 个 结 
构 ， LS Se ciii cun 结构 : 


DEM tiba ptr 


(3) 在 E 明了 一 个 指 癌 dbom 类 型 结构 的 指针 后 ， 现 在 打开 测试 数 
m ss oss 


REAT 


ib RI 

if "pt 
ps utderz, *Failed t pen database'in* 
exit|EXIT FAILURE 


4) d n Oe a to_store 结 构 中 : 


st 


(5) 你 需要 为 每 个 数据 项 建立 一 个 供 以 后 引用 的 关键 字 。 EB 
为 每 个 字符 串 的 头 一 个 字母 加 上 整数 。 这 个 关键 字 由 key_datum 标 识 ， 
而 data_datum 则 指 辐 items_to_store 数 据 项 。 然 后 将 数据 存储 到 数据 库 
Fh. 


(6) 接 下 来 ， 查 看 是 否 可 以 检索 这 个 新 存 入 的 数据 。 最 后 ， 关 闭 
数据 库 : 


编译 并 运行 这 个 程序 ， 它 的 输出 如 下 所 示 : 
gcc -o dbmi -I/usr/include/gdhm dhml.c -1gdbma 
. /dbm1 


如 果 gdbm 是 以 兼容 模式 安装 的 ， 这 就 是 你 将 获得 的 输出 结果 。 如 
果 编 译 失 败 ， 你 可 能 需要 修改 源 文件 中 的 #include 语 句 ， 按 照 源 文件 中 
注释 说 明 的 方法 ， 用 gdbm-ndbm.h 文 件 蔡 换 ndbm.h， 并 在 编译 源 文件 
时 ， 在 链接 主 函 数 库 之 前 移 链 接 兼 容 库 ， 如 下 所 示 : 


gcc -o dbml -I/usr/include/gdbm dbml.c -1gdba compat -lgdbm 


实验 解析 


Bt, TIJPZMQREE, UREAROEE BERE. REAM Ae 
据 的 items_to_store 的 3 个 成 员 。 针 对 每 个 成 员 ， 你 分 别 创建 一 个 索引 关 
键 字 。 为 人 简单 起 见 ， 你 使 用 两 个 字符 串 的 头 一 个 字符 再 加 上 整数 来 构 
成 关键 字 。 

然后 ， 设 置 两 个 datum 结 构 ， 一 个 用 于 关键 字 ， 男 一 个 用 于 存储 的 
数据 。 在 把 3 个 数据 项 存储 到 数据 库 中 之 后 ， 你 构建 一 个 新 的 天 键 字 并 
设置 一 个 datum 结 构 来 指 问 它 。 然 后 ， 使 用 这 个 关键 字 来 从 数据 库 中 检 
索 数 据 。 通 过 检查 返回 的 datuam 结 构 中 的 dptr 成 员 是 否 为 null， 来 判断 
检索 是 否 成 功 。 假 设 它 不 是 null， 你 就 可 以 把 检索 到 的 数据 ( 它 可 能 
储存 在 dbm 库 的 内 部 空间 中 ) 复制 到 你 自己 的 结构 中 。 注 意 ， 要 使 用 
dbm_fetch 返 回 的 长 度 值 《如 果 不 这样 做 ， 并 且 使 用 的 是 可 变 长 数据 ， 
你 可 能 就 会 复制 根本 不 存在 的 数据 ) 。 最 后 ， 打 印 检索 到 的 数据 来 验 
证 是 否 正确 获取 了 数据 。 


7.3.4 dbm 


现在 你 已 知道 了 主要 的 dbm 画 数 ， 本 市 我 们 将 介绍 用 于 dbm 数 据 
库 的 一 些 其 他 函数 : 


int dbm delete(DBM *database descriptor, datum key); 
int dbm error (DBM *database descriptor); 

int dbm clearerr(DBM *database descriptor); 

datum dbm firstkey(DBM *database descriptor); 

datum dbm nextkey(DBM *database descriptor); 


1. dbm deleteEg Zi 

dbm_delete 函 数 用 于 从 数据 库 中 删除 数据 项 。 与 dbm_fetch 一 样 ， 
它 也 使 用 一 个 指向 关键 字 的 datum 类 型 结构 作为 其 参数 ， 但 不 同 的 是 ， 
它 是 用 于 删除 数据 而 不 是 用 于 检索 数据 。 它 在 成 功 时 返回 0。 

2. dbm_error K ži 


dbm_errorK At & FT 3 SS E PE SIR AE, WRA 
就 返回 0。 


3. dbm_clearerr WA 


dbm_clearerr 函 数 用 于 清除 数据 库 中 所 有 已 被 置 位 的 错误 条 件 标 


| 
JQ 2 


4. dbm_firstkey#ldbm_nextkey HU 


JC PN A Bn BOY E A SOT i PE PAS PUB ORE ET T° 
它们 需要 的 循环 结构 如 下 所 示 : 


x 验 检索 和 删除 
在 本 例 中 ， 使 用 上 面 介 绍 的 靳 函数 对 dbml.c 做 一 些 改 进 。 下 面 是 
dbm2.c 的 源 代 码 : 
(1) 复制 一 份 dbmlc， 打 开 它 进行 编辑 。 修改 #define 
TEST DB FILE—17: 


"include <unistd.h> 


nans 


adefine TEST.DB.FILE "/tmp/dbr2 test" 
(2) 然后 只 需要 修改 检索 数据 的 部 分 : 
* now try to delete some data */ 
d idim ptr =| 
f a with k 
ET: in ts 
m= db 4 


其 输出 为 : 


dbe2 


实验 解析 

这 个 程序 的 第 一 部 分 同 前 面 的 例子 完全 一 样 ， 只 是 往 数 据 库 里 储 
存 一 些 数据 。 然 后 构建 一 个 关键 字 来 匹配 第 二 个 数据 项 ， 并 把 它 从 数 
据 库 中 删除 。 

接 下 来 ， 这 个 程序 使 用 dbm_firstkey 和 dbm_nextkey 依 次 访问 数据 
库 中 的 每 个 关键 字 ， 并 检索 数据 。 注 意 ， 数 据 的 获取 并 不 是 按 序 的 : 
按 关 键 字 的 顺序 检索 数据 并 不 意味 着 获取 的 数据 是 有 序 的 ， 它 只 是 一 
种 扫描 所 有 数据 项 的 方式 。 


7.4 ”CD 唱片 应 用 程 


在 学 习 了 环境 和 数据 管理 之 后 ， 现 在 是 时 候 改 进 这 个 应 用 程序 
了 。dbm 数 据 库 看 起 来 很 适合 于 存储 CD 资料 ， 所 以 下 面 将 使 用 dbm 来 
实现 数据 存储 。 


7.4.1 ixi 


因为 这 次 的 更 新 会 涉及 大 量 代 码 的 重 写 ， 所 以 现在 古 个 重新 审视 
设计 决策 以 查看 哪些 地 方 需要 改进 的 好 时 机 。 虽 然 在 文件 中 以 逗号 分 
隅 变量 来 存储 信息 是 一 种 在 shell 中 很 容易 实现 的 方式 ， 但 这 样 做 的 局 
限 性 也 很 大 ， 因 为 许多 CD 标题 和 曲目 都 包含 逗号 。 你 可 以 通过 使 用 
uc aaa mesi ce 
计 元 素 。 
人 
TS 

前 面 的 实现 多 少 都 存在 着 这 样 一 个 问题 ， 即 将 应 用 程序 的 数据 访 
问 部 分 和 用 户 接 口 部 分 混在 了 一 起 ， 这 与 程序 全 实现 在 一 个 文件 中 有 
很 大 的 关系 。 在 这 个 者 的 实现 中 ， 你 将 用 一 个 头 文件 来 描述 数据 和 用 
人 

虽然 可 以 继续 用 curses 来 实现 用 户 接口 ， 但 本 次 实现 将 返回 到 简单 
的 基于 行 的 系统 。 这 不 仅 使 应 用 程序 的 用 户 接口 部 分 既 短 小 又 简单 ， 
而 且 可 以 把 精力 集中 到 其 他 实现 方面 上 去 。 

虽然 还 不 能 在 dbm 代 码 中 使 用 SQL 语句 ， 但 可 以 使 用 SQL 术语 以 
更 正规 的 方式 来 摘 述 狐 数据 库 。 如 果 还 不 熟悉 SQL 语 句 ， 不 用 担心 ， 
我 们 会 解释 这 些 定义 。 你 还 将 在 第 8 革 中 看 到 更 多 对 SQL 语 句 的 介绍 。 
表 可 以 用 下 面 的 代码 来 描述 : 


这 个 非常 简洁 的 描述 表明 数据 域 的 名 字 和 长 度 。cdc_entry 表 中 每 
个 记录 都 有 一 个 唯一 的 catalog 列 。cdt_entry 表 中 曲目 号 不 能 为 零 ， 而 
且 catalog 和 track_no 两 列 的 组 合 是 唯一 的 。 你 将 在 下 一 和 的 代码 中 看 到 
这 些 描述 被 定义 为 typedef struct 结 构 。 


7.4.2 dbm ‘1CD 唱 片 应 用 程 


你 现在 将 通过 使 用 dbm 数 据 库存 储 信息 的 方法 来 重新 实现 应 用 程 
序 。 整 个 应 用 程序 共有 3 个 文件 ， 它 们 是 cd_data.h、app_ui.c 和 
cd_access.c ° 

你 还 将 把 用 户 接口 重 写 为 命令 行程 序 。 在 本 书 的 后 面 章节 中 ， 你 
将 看 到 使 用 不 同 的 客户 /服务 器 机 制 来 实现 应 用 程序 ， 并 最 终 将 其 实现 
为 一 个 能 够 通过 Web 浏 览 器 路 网 络 访问 的 应 用 程序 ， 到 那 时 ， 你 还 将 
重用 这 里 的 数据 库 接 口 和 一 部 分 的 用 户 接 口 。 把 接口 转换 为 更 简单 的 
DUREE E 使 你 能 更 容易 关注 应 用 程序 最 重要 的 部 分 ， 而 不 是 

ZO 

你 将 在 后 面 的 章节 中 看 到 ， 数 据 库 的 头 文 件 cd_datah 和 来 目 文 件 
cd_access.c 里 的 函数 被 多 次 重用 。 


请 记 住 ， 有 些 Linux 发 行 版 需要 稍微 不 同 的 编译 选项 ， E 
源 文件 中 包含 头 文件 gdbm-ndbm.h 而 不 是 ndbm.h , 
lgdbm_compat -lsdhm 而 不 是 只 使 用 -lgdbm。 如果 你 Lim EG 
d cem 就 需要 对 文件 access.c 和 Makefile 进 行 适当 的 


实 验 cd data.h 
no 它 定 义 了 数据 的 结构 和 用 于 访问 这 些 数 据 的 
MFE ° 

(1) 下 面 是 CD 数据 库 的 数据 结构 的 定义 。 它 定义 了 组 成 数据 库 
的 两 个 表 的 结构 和 大 小 。 首 先 定 义 了 几 个 将 会 用 到 的 数据 域 长 度 以 及 
两 个 结构 : 一 个 用 于 标题 数据 项 ， 另 一 个 用 于 曲目 数据 项 : 


得 
' 
4 
ef EN 
T 
iar - i 
ar LE L e 1 
har E 1] 
Ar AT A T P 
; pe 
AT.CAT. LES 
eje! 
-h 1 LEN 
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(2) 在 定义 了 一 些 数据 结构 后 ， 你 可 以 开始 定义 一 些 需要 的 访问 
例 程 了 。 画 数 名 中 包含 cde_ 的 画 数 负责 处 理 标题 数据 项 ， 包 含 cdt 的 
函数 负责 处 理 曲目 数据 项 : 


注意 ， 有 些 函 数 直 接 返回 数据 结构 。 你 可 以 通过 强制 设置 这 
些 结构 的 内 容 为 空 ， 来 表明 画 数 调用 失败 。 


{zation and rmina fur ns 

se initia con èw databa 

base cl 1) 

wo imple data r P! 
cde entry ~ entry og. 
dt ery "d y ! d catalog g n n 5 
/ data addition 
in [1 .em 5 d n entry to add! 
int add. er t j ntry entry_to_add); 
上 lata d 1o 
n ê y net d catalog p 
Y nst a d catalog ptr, t track. 
earch cdc. ry! t ar e rst call pt 


sx 验 app uic 

现在 开始 介绍 用 户 接口 。 这 部 分 程序 相对 来 说 比较 简单 ， 它 实现 
在 一 个 单独 的 文件 中 ， 你 将 用 它 来 访问 数据 库 函 数 。 

(1) 同 往常 一 样 ， 从 头 文件 开始 : 


(define | XOPEN SOURCE 


includes <stdlib.h> 
includes <unistd.h> 
include <stdio.h> 
finclude <string.h> 


finclude *cd_data.h* 


fdefine TMP STRING LEN 125 /* this number must be larger than the biggest 
single string in any database structure */ 


(2) 用 typedef 语 句 定义 菜单 选项 。 这 要 比 用 #define 语 句 定义 常量 
的 方法 好 ， 因 为 它 允 许 编译 器 检查 菜单 选项 变量 的 类 型 . 


typedef enim 1 
mo invalid, 


mo.list car tracks, 
mo.del tracks, 
mo count entries, 
mo exit 

} menu options; 


(3) EM uei d 数 的 原型 。 记 住 ， 实 际 访问 数据 库 
的 函数 的 原型 是 通过 头 文件 cd_data.h 包 含 进 来 的 : 


static int command mode(int argo, char *argv{]); 

static void announce[void!; 

static menu -options show menu[const cdc entry *current các); 
static int get confirmiconst char *question); 

static int enter new cat entry(cdc entry "entry ro update); 
static void enter new track entries[const cdc entry ‘entry to add to); 
static void del cat entry(const cdc entry *entry to delete); 
static void del track entries(const cdc entry *antry to delete); 
static cdc entry find cat(void); 

static void list tracka(const cdc entry *entry to use)! 

static void count all entries[void):; 

static void display các(const các entry *cdc.to show); 

static void display cdt([const cdt entry *cdt to show]; 

static void strip.return(char *string to strip!; 


(4) wa, 2| T maint žit » © 6X current. cdc „entry 结构 进行 初 
化， 用 它 来 保存 当前 选中 的 CD 标题 项 。 还 解析 了 命令 行 ， 宣 布 正在 
运行 的 是 哪个 程序 ， 并 初始 化 数据 库 : 


void main(int argo, char *argv(]) 
( 


menu options current option! 
cdc entry current, cdc entry: 
int command result; 


memset(&current cdc entry, ‘\0', sizeof(current cdc entry])i 


if (arge > 1) { 
command result = command mode[argc, argv); 
exiticommand result]; 

} 


announce!) ; 


if ({darabase initialize(0]) ( 
fprintf(stderr, "Sorry, unable to initialize database\n"); 
fprintf(stderr, *To create a new database use te -i'in*, argv[0]); 
exit(EXIT. FAILURE] | 


(5) 现在 已 准备 好 处 理 用 户 输入 了 。 进 入 一 个 循环 ， 等 待 用 户 选 
择 一 个 菜单 选项 ， 然 后 处 理 它 ， 直 到 用 户 迁 择 退 出 选项 为 止 。 注 意 ， 


把 current_cdc_entry 结 构 传 递 给 show_menu 函 数 。 这 是 为 了 让 荣 单 选项 
能 够 根据 用 户 当 前 选择 的 标题 项 做 相应 的 改变 : 


void maintint argc, char *argv[]) 
{ 


) 


menu options Current option; 
cdc entry current, cdc entry: 
int command, result; 


memset(&current cdr entry, ‘\0', sizeof(current cdc entry])! 


if largc > 1) ( 
command, result = command mode[argc, argv); 
exit|comnand result]; 

j 


announce!) ; 


if (|database_initialize(0)) | 
fprintf(stderr, "Sorry, unable to initialize database in*]; 
fprintf(stderr, *To create a new database une te -iin*, argv[9}); 
exit (EXIT_FAILURE) | 

j à 


(6) =7A MRM, KBE EREA © announce AAA 
于 输出 欢迎 辞 : 


(7) 下 面 列 出 了 show_menu 丽 数 的 内 容 。 这 个 画 数 通过 标题 名 的 
第 一 个 字符 来 检查 当前 标题 项 是 否 被 选中 。 如 果 选 择 了 一 个 标题 项 
用 户 将 看 到 更 多 的 菜单 选项 : 


注意 ， 现 在 要 用 数字 来 选择 菜单 项 ， 而 不 像 在 前 两 个 例子 中 
那样 使 用 首 字 母 。 


printf (*\ninCurrent entry: "); 
printf|*t*s, ts, te, te\n". cde_selected->catalog. 
cdc_selected-stitle, 
cdc selected-»type, 
cóc selectod-»artist] 


printf|[*Win*]; 

printf|*l - add new CD\n"); 

printf|*2 search for a CDin*]; 

printf|*3 - count the CDs and tracks in the database\n"); 
printf['4 - re-enter tracks for current CDin*); 

printf(*5 = deiete this CD, and all its tracke\n*); 
printf|*6ó - list tracks for this CD\n"}: 

printf(*q ~ quitin"); 

printf|*MnOption: *); 

fgets(tep str, TMP_STRING_LEN, stdin); 


awitch(itmp.str[0]) { 


case '1': option chosen * mo add cat; break; 

case '2': option, chosen = mo find cat; break; 

case '3': option chosen « mo count entries; break; 
case '4': option chosen = mo_sdd tracks; break; 

case '5': gption chosen = mo del cat; break; 

case '6': option chosen * mo list cat tracks; break; 
case 'q': option chosen = mo exit: break; 


l 
else 【 
printft(*\n\n°); 
printf(*l1 = add new CD\n"); 
rintf(*2 ~ search for a CD\n*); 
rintf(*3 ~ count the CDs and tracks in the database\n"); 
printfí*q ~ quit'in"!; 
printf(*\nOption: *)+ 
fgetmi(tmp atr, THP_STRING_LEN, atdin); 
switchitmp str[0]) ( 


case '1': option chosen = mo, add, car; break; 

case '2': option chosen * mo find cat; break; 

cage '3': option chosen = mo count entries; break; 
case 'q': option chosen = mo.exit; break; 


J 
) /* while */ 
return(option, chosen! ; 


(8) 你 需要 在 多 个 地 方 询问 用 户 ， 让 用 户 确认 他 的 请 求 。 我 们 并 
未 让 这 段 提问 代码 多 次 出 现在 程序 中 ， 而 是 抽取 这 段 代 码 组 成 一 个 单 
独 的 函数 get_confirm: 


static int get confirm(const char "quastion) 
i 


char tmp str[7MP STRING LEN + 1); 


printf(*tsa*, question); 

fgetn(tmp str, TMP STRING LEN, stdin), 

if (tmp str[0] == 'Y' || tmp.str[0] == 'y*) { 
return (1) | 

! 

return(0) : 


(9) ExXXenter new cat entry] E Fl ze VE Fd P8 A — 1 Br be 
项 。 你 并 不 想 保 存 由 fgets 函 数 返 回 的 换行 符 ， 所 以 把 它 去 掉 : 


HB, MRA AgetswN, ANCLEREREK EN i 
出 。 你 应 总 是 避免 使 用 gets 画 数 ! 


static int enter new cat entry[|cdc entry *entry_to_update) 


code entry new entry: 
char tzp str[TM?P STRING LEN + 1] 


memsetiknew entry, *\0', gizeofinew entryl)!i 
printf("Enter catalog entry: "Ji 

(void) fgets itap str. TMP STRING.LEN, stdin); 
stríp retum|[tmp. str) ; 


strncpy(new entry.catalog, tzp.str, CAT.CAT.LEN - i); 


printf("Enter title: °); 

[(voíd)fgetmitzp str, TMP.STRING LEN, stdin); 
strip return[tmp, str! ; 

strncpy(new entry.títle, tmp str, CAT TITLE LEN 


TMP, STRING, LEN, stdin); 
scrip return|tmp str); 
strncpy(new entry.type, tmp str, CAT TYPE LEN i)? 


TMP_STRING_LEN, stdin): 


in S em 


5 
3 
- 
t 
+ 
e 
a 
TY 
e" 
d 
“a 
+ 
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CAT_ARTIST_LEN 1); 


printf('irNew catalog entry entry ia :-\n"): 
display các (knew entry! ; 
if (get confirm|"Add this entry ?*)] { 
memcpy(entry to.update, &new entry, sisest [new entry) ) 
returnil 


0) 下 面 是 用 于 输入 曲目 信息 的 函数 enter_new_track_entries。 


(1 
oe rT EK RR AR A, AA UR POTE RB OE 
Zi: 


Sat entry new track, existing track 
char tmp 


*"MUpdating tracks for $sin', entry to add to-»catalocg!: 
"Press return to leave existing 8 tion unchanged, in"): 


tracks, \n* 


(11) 首先 ， 必 须 检查 当前 曲目 编号 处 是 否 已 有 曲目 存在 。 根 据 
查询 结果 ， 程 序 将 对 提示 做 相应 的 修改 : 


b Tra 1 p 
fgets mp- TMI RING LEN, stdir 
rip. re 


(1 2) 如 果 当 前 曲目 编号 处 没有 现存 曲目 ， 而 且 用 户 也 未 添加 一 
条 记录 ， lla ee Uca 


break 


(13) 如 果 用 户 输 入 一 个 单独 的 字符 d， 这 将 会 删除 当前 以 及 更 高 
曲目 记录 。 如 果 del_cdt_entry 芳 数 找 不 到 等 删除 的 曲 上 日 ， 它 将 会 
3k [4] false: 


(14) 下 面 这 段 代码 的 作用 是 添加 一 个 新 的 曲目 或 者 更 新 一 个 现 
有 曲目 。 首 先 构 建 一 个 cdt_entry 结 构 new_track， 人 然后 调用 数据 库 函 数 
add_cdt_entry 来 把 它 添加 到 数据 库 中 : 


(15) 函数 del_cat_entry 删 除 一 个 标题 项 。 如 果 标 题 项 被 删除 了 ， 
那么 原来 属于 它 的 曲目 记录 也 都 将 被 删除 : 


(16) 接 下 来 这 个 函数 的 作用 是 删除 与 某 个 标题 项 对 应 的 所 有 曲 


(17) 下 面 是 一 个 非常 简单 的 标题 搜索 函数 。 它 允许 用 户 输入 一 
个 字符 串 ， 然 后 查找 包含 这 个 字符 串 的 标题 项 。 因 为 可 能 存在 多 个 匹 
配 的 记录 ， 所 以 只 是 依次 将 每 个 匹配 的 记录 提供 给 用 户 : 


atatic cdc entry find cat iveid) 
{ 
cdc entry item found; 
char tmp_etr[{TMP_STHING_LEN + i); 
int first call = i: 
int any entry found = 0; 
int stríng ok; 
int entry selected « 0; 


de ( 
string ok = 1; 
printf|*Enter string to search for in catalog entry: “I: 
fgeta(tzp str, TMP STRING LEN, stdin); 
strip return(tep stri; 
if (strlenitmp str) > CAT.CAT.LEN] | 
fprintfistderr, *Sorry, string too long, maximum td | 
Characters in*, CAT CAT. LEN); 
String ok * 0; 
) 
) while |!string.ok): 


while |'entry selected) [ 
item found = search các entryitmp str, kirst call}: 
if (item found.catalog[O] != ‘\0') { 
any.entry found = 1; 
printfi**n*li 
display cdc(hitem found); 
if (get_confirm(*This entry? *)) { 
entry geiected = 1: 
) 
) 
else | 
if (any entry found) printf(*Sorry, no more matches foundin"!i: 
else printf('Sorry, nothing foundAn*!; 
break; 
] 
j 
return (item found]; 


(18) list_tracks 函 数 用 于 输出 指定 标题 项 的 所 有 曲目 : 


static void list_tracks(const cdo entry *entry to use] 
t 

int track no = 1; 

cdt entry entry found; 


display cdclentry.to use); 
printf|*AnTracksWn" | ; 
do | 
entry.found * get cdt entry(eantry to.use-»caraiog, 
track no): 


if [entry found.catalog[0]] t 
display cdt[&encry, found); 
track not; 

) 

) whilelentry found.catalog[0]); 
(void)get confirm("Press return"); 
) /* list tracks */ 


(19) count_all_entries 函 数 用 于 统计 所 有 曲目 数量 : 


z(*Pr returz 


(20) 下 面 是 display_cdc 函 数 ， 它 用 来 显示 一 条 标题 项 记录 : 


atalog ta n° ilc to show-»catalog 


display_cdt 函 数 的 作用 是 显示 一 条 曲目 项 记录 : 


HOwW-> Crack 


(21) strip. return EX 2 B VE Al ze itl RFF FB RB A RTT FF oe dU 
Linux 同 UNIX 一 样 ， 使 用 一 个 单独 的 换行 符 来 表明 一 行 的 结 


p. mz *string.to. B p 


TE. 


a 


len = strien(string to. strip]; 


tring co stripllen 1] == 'in string. to strip[lenr - 1] = TCH 


(22) command_mode 和 是 一 个 对 命令 行 参数 进行 解析 的 函数 。 其 
中 调用 的 getopt 函 数 是 一 个 确保 程序 能 够 接受 符合 标准 Linux 规 范 的 参 
数 的 好 方法 : 


SE H cd access.c 
现在 开始 介绍 用 于 访问 dbm 数 据 库 的 函数 : 
(1) 与 往常 一 样 ， 你 从 包含 头 文 件 开始 。 然 后 用 姑 efine 语 句 指定 
将 用 来 存储 数据 的 文件 : 


mista. h> 
atdlib.h> 


(2) 使 用 下 面 两 个 文件 范围 变量 追踪 当前 的 数据 库 


(3) 默认 情况 下 ，database initialize 芳 数 打 开 一 个 已 有 的 数据 


库 ， 但 通过 传递 一 个 非 零 的 〈 即 布尔 值 为 真 ) 参数 new_database 给 
它 ， 你 就 可 以 强迫 它 创 建 一 个 新 的 〈 空 ) 数据 库 ， 并 有 效 地 删除 任何 


已 有 的 数据 库 。 如 有 果 数 据 库 被 成 功 初始 化 ， 那 么 两 个 数据 库 指针 也 被 
初始 化 ， 以 此 表明 数据 库 被 打开 : 


(4) database_close 函 数 用 于 关闭 已 打开 的 数据 库 ， 并 将 两 个 数据 
库 指 针 设 为 null， 以 此 表明 当前 没有 打开 的 数据 库 : 


(5) 接 下 来 这 个 函数 ， 当 给 它 传递 一 个 指向 标题 项 文本 字符 串 的 
指针 时 ， 它 将 检索 出 一 个 标题 项 来 。 如 采 标 题 项 没有 找到 ， 其 返回 数 
据 中 的 标题 域 将 为 至 : 


(6) 画 数 先 做 一 些 完整 性 检查 ， 确 保 数据 库 已 打 开 而 且 你 传递 了 
一 个 合理 的 参数 DEL UAA AEREE Ainul 


(7) WV EdbmER ZI BN datumZE T, SRA fi Fl dbm. fetch ER Ze 
检索 数据 。 如 果 没 有 数据 可 以 获得 ， 你 将 返回 先前 初始 化 过 的 空 的 


entry_to_return 结 构 : 


har *)local.data_datum.dper 


(8) 你 希望 还 能 对 一 个 单独 的 曲目 项 进行 检索 ， 这 正 是 下 面 这 个 
男 数 实现 的 功能 。 它 与 get_cdc_entry 范 数 的 工作 方式 基本 类 似 ， 不 过 
它 需 要 一 个 指 同 标 题字 符 串 的 指针 和 一 个 曲目 编号 作为 参数 : 


3.5 


nd[CAT.CAT.LEN + 1! 


Cai dara datum 


(9) 下 一 个 画 数 add_cde_entry 的 作用 是 增加 一 个 新 的 标题 项 记 


int add các entryiconst cdc entry entry. to add) 
{ 

char key to sdd[CAT CAT. LEN * 1]; 

datum local data. datum; 

datum local key datum; 

int result; 


/* check database initialized and parameters valid */ 
if [(!cdc dtm per || !cdt dbm ptr) return (0); 
if (atrlenientry.to add.catalog] >s CAT.CAT.LEN] return (0); 


/* ensure the search key contains only the valíd string and nulls */ 
memset[&key tc add, ‘\0', sizeofikey to adi]l]; 
stropy [kay to aå, entry to add.catalogl: 


iocai_xey_datum.dptr = (void *) key to add; 
local key datum.dsire = sizeof(Xay to add); 
iocal data datum.dptr = (void *) &entry, to add; 
local data datum.dzize = sizeoflentry to add]: 


result = dbm stcre([cdc dhe ptr, local key datum, local data. _ datum, 
DBM REPLACE! : 


/* dbm etore() uses 0 for success */ 
if |result ss 0) return {1}; 
return (0): 


(10) add_cdt_entry 画 数 的 作用 是 增加 一 个 新 的 曲目 项 记录 。 标 
题字 符 串 和 曲目 编号 组 合 在 一 起 构成 其 访问 关键 字 : 


int add cdt entry(const cdt entry entry. to add) 
( 

char key to add[CA7 CAT LEN + 10); 

datum local data datum: 

datum local key, datum; 

int result; 


if (tcdc dbm ptr || !cdt dbm ptr) return (0); 
if (strlenientry_to_add.catalog) >= CAT.CAT.LEN!| return (0); 


memset (Sikey_to add, ‘\0', sizeof(key to add)]: 
sprintf(key to add, "V5 td", entry to, add.catalog, 
entry. to add.track no]: 


local key datum.dptr = [void *) key to add: 
local key datum.dsize = gizeof(key ro add!; 
local data datum.dptr = (void *) &entry to add; 
local data datum.dsize « sizeoflentry to add}; 


result = dbm store|cdt dbm ptr, local key datum, local data datum, 
DEX REPLACE) | 


/* dba store(] uses 0 for success and -ve numbers for errors */ 
1f [result == 0} 


return (1); 
return (0); 


(11) 既然 可 以 往 数 据 库 里 增加 数据 ， 你 最 好 还 能 灿 
面 这 个 函数 的 作用 束 删 除 标 题 项 记录 : 


I 除 它 们 。 下 


(12) 与 上 面 的 函数 类 似 ， 这 个 函数 用 于 删除 曲目 记录 。 记 住 ， 
曲目 关键 字 是 由 标题 项 字符 串 和 曲目 编号 两 者 构成 的 一 个 复合 索引 : 


(13) 最 后 非常 重要 的 一 点 是 ， 你 还 有 一 个 简单 的 搜索 函数 。 它 
不 是 非常 复杂 ， 但 它 演 示 了 如 何在 预先 不 知道 关键 字 的 情况 下 扫描 全 
部 的 dbm 记 录 项 e 

因为 你 事先 并 不 知道 会 有 多 少 匹 配 的 记录 项 ， 所 以 你 将 这 个 函数 
实现 为 每 次 调用 返回 一 个 记录 项 。 如 果 什 么 也 没 找到 ， 记 录 项 就 将 是 
空 的 。 为 了 扫描 整个 数据 库 ， 你 在 调用 这 个 函数 时 使 用 一 个 指 癌 整数 
的 指针 *first_call_prt， 它 在 函数 第 一 次 被 调用 时 应 被 设置 为 1， 然 后 这 
个 函数 就 知道 它 应 该 在 数据 库 的 起 始 处 开始 搜索 。 在 后 续 的 调用 中 ， 
这 个 变量 将 被 设置 为 0， 函 数 将 会 从 上 次 找到 记录 项 的 位 置 开始 继续 搜 


Z o 
A Aa EE EBT AP RE BRAY, ECM ae ah EY, PRD AR 
把 *first_call_ptr 的 值 设 为 真 ， 然 后 再 次 调用 这 个 函数 ， 这 将 重新 初始 


化 搜索 。 

在 这 个 函数 的 两 次 调用 之 间 ， 函 数 维护 一 些 内 部 状态 信息 。 这 样 
Bye IRRE ATE, 同时 保留 了 搜索 函数 在 具 
体 实现 方面 的 秘密 。 

如 果 搜 索 文本 指针 指向 null 子 符 ， 那 么 所 有 的 记录 项 部 将 被 认 为 
征 匹配 的 。 


(14) 和 往常 一 样 ， 先 做 完整 性 检查 : 


(15) 如 果 这 个 函数 被 调用 时 ，*first_call_ptr 被 设置 为 tue， 就 表 
示 你 需要 从 数据 库 的 起 始 位 置 开始 搜索 (或 重新 开始 搜索 。 如 果 
*first_call speeds 是 true， 你 只 需 移动 到 数据 库 中 的 下 一 个 关键 字 : 


turn, {char 
m.dsize 


(1 6) 搜索 方式 非常 简单 只 是 检查 当前 标题 项 是 否 包含 搜索 


ie sf sear s 
st r itr 1 atalog I 
[ 
me to n 
5 entr return) ) 
a ey datum dom nex dc db 
) 
&l key datum. or ki 
cal data um. ap E 
t ur lògic 
Urn 


现在 你 将 通过 下 面 的 makefile 文 件 把 所 有 的 程序 结合 在 一 起 。 现 在 
还 无 须 太 过 操心 它 ， 因 为 你 马上 了 束 要 在 下 一 章 中 了 解 它 的 工作 原理 。 
它 的 内 容 并 将 其 保存 为 Makefile 文 件 即 可 : 


applic 


HICUUDE: us gdines 

ra Te a bu ^s may nee t ange ne lud 
' d A ig brary, As shown 

app pp. 

“gee $ (CFLAG NCLUDE) -c a 

A aay A a 

yo app 
nodbmfiles: 

要 起 编译 这 个 新 的 CD 唱 请 应 用 程序 ， 你 需要 在 提示 符 后 输入 下 面 

的 命令 : 
$ make 


OE 切 顺 利 ， 可 执行 文件 application 将 被 编译 并 放置 到 当前 目录 


7.5 人 小结 


- 


在 本 章 中 ， 你 学 习 了 数据 管理 的 3 个 方面 知识 。 首 先 ， 你 学 习 了 
Linux 内 存 系统 的 知识 ， 虽 然 按 需 换 页 虚拟 内 存 的 内 部 实现 非常 复杂 ， 
但 它 的 使 用 还 是 相当 简单 的 。 你 还 学 习 了 它 是 如 何 保护 操作 系统 和 其 
他 进程 免 受 非法 内 存 访问 侵害 的 。 

接 下 来 ， 我 们 介绍 了 文件 锁定 功能 是 如 何 允 许多 个 程序 在 访问 数 
据 时 协调 工作 的 。 你 首先 看 到 了 一 个 简单 的 二 进 制 信号 量 机 制 。 然 后 
征 一 个 更 复杂 的 情形 ， 即 用 共 理 锁 和 独占 锁 来 锁 住 同一 个 文件 的 不 同 
部 分 。 然 后 我 们 介绍 了 dbm 库 ， 它 具有 使 用 一 个 非常 灵活 的 索引 布局 
来 存储 和 高 效 地 检索 任意 数据 块 的 能 力 。 

最 后 ， 我 们 用 dbm 库 作为 数据 存储 技术 重新 设计 并 实现 了 CD 唱片 
应 用 程序 。 


第 8 章 MySQL 


至 此 ， 我 们 已 经 探讨 了 使 用 平面 文件 进行 一 些 基本 的 数据 管 
理 ， 随 后 又 介绍 了 简单 但 却 非常 快速 的 dbm。 现 在 我 们 将 介绍 一 个 功 
能 更 齐全 的 数据 工具 ， RDBMS 或 关系 型 数据 库 管理 系统 (Relational 
Database Management System) ° 

两 个 最 著名 的 开源 RDBMS 应 用 软件 是 PostgreSQL 和 MySQL 。 
PostgreSQL 能 在 任何 情况 下 免费 使 用 。 MySQL Ete REE Pita ge 
收取 许可 证 费用 ， 但 在 许多 场合 下 它 还 是 免费 的 。 用 于 同一 用 途 的 次 
业 产 品 有 Oracle、Sybase 和 DB2， 它 们 都 能 运行 于 多 种 平台 之 上 。 仅 文 
持 Windows 平 台 的 微软 SQLServer 是 市 场 上 的 男 一 个 分 文 。 所 有 这 些 产 
品 包 都 有 它们 独特 的 优点 ， 但 由 于 本 书 的 容量 限制 以 及 宣传 开源 软件 
的 义务 ， 本 书 将 只 专注 于 MySQ Le 

MySQL 的 起 源 大 约 要 追溯 到 1984 年 ， 但 在 MySQL AB 公 司 的 赞助 
之 下 ，MySQL 用 于 商业 开发 和 管理 已 经 有 许多 年 了 。 虽 然 MySQL 是 
开源 的 ， 但 它 的 使 用 条 款 经 常 与 其 他 的 开源 项 目 发 生 混 清 。 因 此 ， 我 
们 有 必要 在 这 里 指出 ， 虽 然 它 在 许多 场合 下 的 使 用 是 遵循 GPL 的 ， 但 
是 也 有 许多 场合 下 你 必须 购买 它 的 商业 许可 证 才能 使 用 它 。 

如 果 你 需要 一 个 开源 数据 库 ， 但 是 义 无 法 接受 在 GPL 之 下 使 用 
MySQL 的 条 球 ， 并 且 你 不 希望 购买 它 的 商业 许可 证 ， 那 么 在 写作 本 书 
的 时 候 ， 因 为 使 用 PostgreSQL 的 许可 证 条 款 不 存在 那么 多 限制 ， 你 或 
许可 以 考虑 使 用 具备 更 强 功 能 的 PostgreSQL 数 据 库 。 有 关 PostgreSQL 
的 更 多 详细 资料 见 网 址 www.postgresql.org ° 


要 了 解 更 多 有 关 PostgreSQL 的 内 容 ， 请 查阅 我 们 的 书籍 
K PostgreSQL: 从 入 门 到 专家 》 (Beginning Databases with 
PostgreSQL: From Novice to Professional) 第 二 版 (Apress, 2005, 
ISBN 1590594789) ° 


在 本 章 中 ， 我 们 将 介绍 下 面 一 些 MySQL 主 题 ; 


[L] DJ F1 EL] 


安装 MySQL 

必 备 的 MySQL 管 理 命令 

MySQL 的 基本 功能 

从 C 程 序 访问 MySQL 数 据 库 的 API 

H C 语 言 创 建 一 个 用 于 我 们 的 CD 数据 库 应 用 程序 的 关系 型 
率 


8.1 


无 论 你 喜欢 使 用 的 是 哪 种 Linux 套 件 ， 你 的 Linux 套 件 很 可 能 已 提 
供 了 预 编译 的 MySQL 版 本 进行 安装 。 例 如 ，Red Hat、SUSE 和 Ubuntu 
都 在 它们 的 当前 发 行 版 中 提供 了 预 编译 的 MySQL 软 件 包 。 一 般 来 说 ， 
我 们 建议 读者 使 用 预 编译 的 版 本 ， 因 为 它 提 供 了 一 种 最 简单 的 快速 建 
立 并 运行 MySQL 的 方法 。 如 果 你 的 发 行 版 未 提供 MySQL 软 件 包 ， 或 
者 你 想 使 用 最 新 的 MySQL 上 版本， 那么 你 可 以 从 MySQL 的 网 站 上 下 载 
二 进 制 包 和 源 代 码 包 。 

在 本 革 中 ， 我 们 只 介绍 如 何 安 闭 预 编译 的 MySQL 版 本 。 


8.1.1 MySQL 软 件 包 


WH FRR AL Be is BEB Ek MySQL 而 不 是 使 用 与 Linux 套 件 捆绑 的 版 
本 ， 对 本 书 而 言 ， 你 应 该 使 用 MySQL 社 区 版 中 的 标准 软件 包 。 你 会 看 
到 还 有 Max 和 Debug 软 件 包 可 以 使 用 。 其 中 Max 软 件 包 包含 一 些 额 外 的 
功能 ， 如 支持 更 多 不 常见 的 存储 文件 类 型 和 一 些 高 级 功能 (如 集 
FE) 。Debug 软 件 包 在 被 编译 时 包含 了 一 些 额 外 调试 代码 和 信息 ， 硕 
望 你 不 需要 使 用 这 么 故 层 的 调试 。 


不 要 在 正规 场合 使 用 Debug 版 本 ， 因 为 额外 的 调试 支持 会 降 
低 软件 的 性 能 。 


为 了 开发 MySQL 应 用 程序 ， 你 不 仪 需要 安装 MySQL 服 务 絮 ， 还 
需要 安装 MySQL 开 发 库 。 通 常情 况 下 ， 软 件 包 管理 器 都 会 有 一 个 
MySQL 选 项 ， 你 只 需要 确认 开发 库 已 被 选择 安装 。 在 图 8-1 中 ， 你 可 
以 看 到 Fedora 的 软件 包 管 理 絮 选择 了 额外 的 开发 软件 包 以 安装 
MySQL 。 
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在 其 他 Linux 发 行 版 中 ， 软 件 包 的 安排 可 能 略 有 不 同 。 例 如 ， 图 8- 
2 显示 了 Ubuntu 的 synaptic 软 件 包 管理 需 选 择 MySQL 软 件 包 的 寞 面 。 

MySQL 在 安装 时 还 会 创建 用 户 “mysql”*， 该 用 户 是 MySQL 服 务 器 
守护 进程 运行 时 所 使 用 的 默认 用 户 名 。 

在 安装 完 MySQL 软 件 包 之 后 ， 你 需要 检查 MySQL 是 否 已 目 动 启 
动 了 。 在 写作 本 书 的 时 候 ， 有 些 Linux 发 行 版 如 Ubuntu 是 这 么 做 的 ， 但 
也 有 一 些 Linux 发 行 版 如 Fedora 没 有 这 么 做 。 和 至 运 的 是 ， 检 查 MySQL 服 
务 器 是 否 正在 运行 是 一 件 非 常 容易 的 事情 : 

$ ps -el | grep mysqld 


instaliec (local o obsolete) 
avstalled (upgradable) 


| 
Not installed 
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图 8-2 


如 采 你 看 到 有 一 个 或 多 个 mysqld 进 程 正在 运行 ， pu n n 
服务 器 已 司 动 了 ° ER SLi ES 你 还 会 看 到 存在 一 


safe mysqld 进 程 ， 
HE 


是 一 个 以 正确 的 用 户 id 启 动 真正 的 mysqld 进 程 的 


如 果 需 要 启动 〈 或 重启 、 停 止 ) MySQL 服 务 器 ， 你 可 以 使 用 GUI 
界面 的 服务 控制 面板 。Fedora 的 服务 配置 面板 如 图 8-3 所 示 。 
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在 每 次 Linux 启 动 时 自动 运行 。 


8.1.2 ”安装 后 的 配置 


假设 一 切 运行 正常 ， 现 在 MySQL 已 经 安 狼 完成 并 以 默认 选项 集 局 
动 了 。 下 面 让 我 们 来 测试 这 一 假设 是 否 正 确 : 

$ mysql -u root mysql 

如 果 看 到 “Welcome to the MySQL monitor" 信 息 和 一 个 mysql> 提 示 
符 ， 就 表示 服务 器 正在 运行 了 。 当 然 ， 现 在 任何 人 都 能 连接 到 服务 器 
并 拥有 管理 员 权 限 ， 我 们 将 在 稍 后 解决 这 个 问题 。 试 着 输入 \s 来 得 到 
更 多 关于 服务 需 的 信息 。 看 完 后 ， 输 入 quit 或 者 \q 退 出 控制 台 。 

使 用 命令 mysql-? 可 以 获得 更 多 有 天 服务 铝 的 信息 。 在 该 命令 的 
输出 中 ， 有 一 条 重要 信息 值得 注意 。 在 该 命令 输出 参数 列表 之 后 ， 你 
通常 将 看 到 类 似 Default options are read from the followingfiles in the 
given order: 这 样 的 一 句 话 。 它 告诉 你 在 哪里 可 以 找到 配置 文件 ， 如 
有 末 需 要 配置 MySQL 服 务 右 ， 你 就 需要 用 到 该 文件 。 配 置 文件 通常 


= 


是 /etc/my.cnf ， 也 有 一 些 发 行 版 (如 Ubuntu) 使 用 的 
是 /etc/mysql/my.cnf ° 

你 也 可 以 使 用 mysqladmin 命 令 来 查看 正在 运行 的 服务 右 状 态 : 

$ mysqladmin -u root version 

XS fg AST NCEP A AR ie EIST, ARR A 
正在 使 用 的 服务 器 的 版 本 号 。mysqladmin 命 令 还 可 以 借助 使 用 
variables 选 项 检查 一 个 正在 运行 的 服务 器 中 的 所 有 配置 选项 : 

$ mysqladmin variables 

上 面 的 命令 将 输出 一 长 串 变 量 设置 。 其 中 两 个 特别 有 用 的 变量 
是 : datadir 和 have_innodb ， 前 者 告诉 你 MySQL 在 哪里 存储 它 的 数据 ， 
后 者 的 值 通常 是 YES ， 表 明 MySQL 服 务 器 文 持 InnoDB 存 储 引擎 。 
MySQL 文 持 好 几 种 存储 引擎 ， 即 用 于 数据 存储 的 底层 实现 程序 。 节 冰 
见 (也 是 最 有 用 ) 的 两 个 存储 引擎 是 InnoDB 和 MylSAM， 但 也 有 一 些 
其 他 的 存储 引擎 ， 如 memory 引 等 ， 它 根本 不 使 用 永久 存储 ， 而 CSV3 引 
擎 则 使 用 去 号 分 隔 的 变量 文件 。 不 同 的 引 警 有 着 不 同 的 功能 和 性能。 
对 于 通用 数据 库 来 疯 ， 我 们 目前 建议 使 用 mnoDB 人 存储 引擎 ， 因 为 它 在 
性 能 和 对 加 强 不 同 数据 元 素 之 间 关 系 的 文 持 上 取得 了 一 个 很 好 的 折 
中 。 如 果 服 务 器 没有 启用 对 InnoDB 的 支持 ， 请 检查 配置 文 
件 /etc/my.cnf， 在 skip-innodb 一 行 的 开头 加 上 # 号 以 注释 挥 该 行 ， 然 后 
使 用 服务 编辑 器 重启 MySQL。 如果 这 样 做 不 行 ， 那么 你 使 用 的 
MySQL 版 本 可 能 在 编译 时 没有 包含 InnoDB 的 支持 。 如 果 这 对 你 很 重 
要 ， 那 么 请 检查 MySQL 网 站 以 找到 一 个 支持 InnoDB 的 版 本 。 对 于 本 章 
来 说 ， 即 使 你 使 用 的 十 MylISAM 和 存储 引擎 也 没有 关系 ， 许 多 发 行 版 默 
认 使 用 的 惑 是 这 个 引擎 。 

一 旦 知道 服务 器 二 进 制 代码 中 已 包括 了 对 InnoDB 的 文 持 ， 为 了 将 
其 设置 为 默认 存储 引擎 ， 你 必须 按 如 下 方法 修改 /etcmy.cnf 文 件 ， 否 则 
服务 器 默认 使 用 的 就 是 MylSAM 引 人 擎 。 修 改 方法 非常 简单 ， 
f£ etc/my.cnf XIF A mysqld — T F IH default-storage-engine-INNODB 
一 行内 容 。 如 下 所 示 文 件 的 开头 : 

[mysqld] 

default-storage-engine=INNOD 

datadir=/var/lib/mysql 


在 本 章 的 剩余 部 分 ， 我 们 假设 默认 的 存储 引擎 已 被 设置 为 
InnoDB ? 

在 实际 的 应 用 环境 中 ， 你 通常 还 会 想 改变 由 datadir 变 量 设置 的 默 
认 存 储 位 置 。 这 也 是 通过 编辑 /etcmy.cnf 配 置 文件 中 的 mysqld 一 下 来 完 


成 的 。 例 如 ， 如 果 你 使 用 的 是 ImnoDB 存 储 引 警 ， 准 备 将 数据 文件 放 
在 /vo102 目 录 中 ， 将 日 志文 件 放 在 /Vo103 目 录 中 ， 设置 数 据 文件 的 初 
始 大 小 为 10M， 并 允许 它 目 扩充 ， 你 可 以 使 用 如 下 的 配置 行 : 

innodb data home dir = /vo102/mysql/data 

innodb data file path = ibdatal: 10M:autoextend 

innodb log group home dir = /vo103/mysql/logs 


你 可 以 在 www.mysql.com 网 站 上 的 在 线 手册 中 了 解 更 多 信息 。 


如 有 果 服 务 器 不 能 局 动 或 服务 句 局 动 后 你 无 法 连接 到 数据 库 ， 
请 阅读 下 一 节 来 诊断 安 凌 中 的 问题 。 


好 的 ， 还 记得 之 前 我 们 提 到 的 那个 巨大 的 安全 漏洞 吗 ? 它 允 许 任 
何人 以 root 用 户 吴 份 进行 连接 而 不 需要 输入 密码 。 现 在 是 时 候 提高 服 
务 器 的 安全 性 了 。 你 千 万 不 要 被 MySQL 安 装 中 所 使 用 的 root 用 户 名 搞 
糊涂 了 ，MySQL 的 root 用 户 和 系统 的 root 用 户 蝇 无 和 关系。MVySQL 只 不 
过 默认 使 用 一 个 称 为 “root* 的 用 户 作为 管理 用 户 ， 就 像 Linux 操 作 系 统 
一 样 。MySQL 数 据 库 的 用 户 和 Linux 系 统 的 用 户 ID 没有 关系 ，MySQL 
有 它 目 己 的 内 置 用 户 和 权限 管理 。 在 默认 情况 下 ， 只 要 在 Linux 系 统 
有 账号 的 用 户 都 可 以 以 MySQL 管 理 员 的 喘 份 登录 进 MySQL 服 务 右 。 
一 旦 你 收 紧 了 MySQL 中 root 用 户 的 权限 ， 如 只 允许 本 地 用 户 以 root 用 户 
身份 登录 并 设置 了 访问 密码 ， 你 束 可 以 只 添加 对 你 的 应 用 程序 正常 工 
作 绝 对 必要 的 用 户 和 权限 了 。 

有 很 多 设 定 root 用 户 密码 的 方法 ， 最 人 简单 的 方法 是 使 用 如 下 命 
S 

$ mysqladmin -u root password newpassword 

这 将 设 定 初 始 密码 为 newpassword ° 

但 是 ， 这 个 方法 会 引发 问题 ， 因 为 明文 密码 将 会 留 在 shell 的 历史 
记录 中 ， 并 且 当 命令 正在 执行 时 ， 其 他 人 可 以 使 用 ps 命令 看 到 该 密 
码 ， 或 者 通过 你 的 命令 历史 记录 重 现 该 密码 。 一 个 更 好 的 方法 是 再 次 
使 用 MySQL 控 制 台 ， 这 次 是 发 送 一 些 SQL 语 句 来 修改 你 的 密码 。 

$ mysql -u root 

Welcome to the MySQL monitor. Commands end with; or \g. 

Your MySQL connection id is 4 


Type ‘help;’ or ‘\h’ for help. Type ‘\c’ to clear the buffer. 


mysql> SET password=PASSWORD (‘secretpassword’ ); 


Query OK, 0 rows affected (0.00 sec) 

当然 ， 你 需要 选择 一 个 只 有 你 目 己 知道 的 密码 ， 而 不 是 例子 中 
的 “secretpassword”， 这 个 密码 只 是 用 来 显示 你 自己 的 密码 应 该 输入 的 
位 置 。 如 采 你 又 想 要 删除 这 个 密码 ， 你 只 需 用 一 个 空 字 符 串 代 


还“secretpassword” 即 可 。 


请 注意 ， 我 们 使 用 一 个 分 号 (; ) 来 结束 SQL 命令 。 严 格 来 
说 ， 分 号 并 不 是 实际 SQL 命令 的 一 部 分 ， 它 只 是 告诉 MySQL 窗 户 
端 程 序 我 们 的 SQL 语句 已 准备 好 被 执行 了 。 我 们 还 为 SQL 关键 字 
使 用 了 大 写字 母 ， 如 SET。 这 并 不 是 必需 的 ， 因 为 实际 的 MySQL 
语法 允许 关键 字 使 用 大 写 或 小 写字 母 ， 但 我 们 在 本 书 中 以 及 在 日 
cor E cuore Mab eu 
句 更 容易 阅读 。 


现在 检查 一 下 权限 表 以 确认 密码 已 被 设置 。 首 先 使 用 use 命 令 切换 
到 mysdql 数 据 库 ， 人 然后 查询 内 部 表 : 


1» use mysqi 
Tysq SELECT user, host, password FROM user; 


注意 观察 ， 我 们 为 从 localhost 建 立 连接 的 root 用 户 创 建 了 一 个 密 
码 。MySQL 不 仅 能 为 用 户 保存 不 同 的 权限 ， 也 能 为 基于 主机 名 的 连接 
类 保存 不 同 的 特权 。 确 保安 装 安全 的 下 一 步 将 是 去 除 那 些 由 MySQL 默 
ee ree ° 下 面 的 命令 将 会 从 权限 表 中 删除 所 有 非 root 


mysql> DELETE FROM user WHERE user != ‘root’; 
Query OK, 2 rows affected (0.01 sec) 

下 一 条 命令 将 删除 从 localhost 以 外 的 任何 主机 的 登录 : 
mysql> DELETE FROM user WHERE host != ‘localhost’ ; 
Query OK, 1 row affected (0.01 sec) 

最 后 ， 使 用 如 下 命令 来 检查 是 否 还 有 遗漏 的 登录 : 


mysq SELECT user, host, password FROM user; 


mu RN 我 们 现在 只 有 一 个 仅 能 从 localhost 连 接 


现在 是 验证 事实 的 时 刻 了 : 我 们 仍 能 使 用 设 定 的 密码 来 登录 吗 ? 
注意 ， 这 次 我 们 给 出 -p 参 数 ， 它 要 求 MYSQL 必须 给 出 询问 密码 的 提 
ZN: 

$ mysql -u root -p 

Enter password: 

Welcome to the MySQL monitor. Commands end with ; or \g. 

Your MySQL connection id is 7 


Type ‘help;’ or ‘\h’ for help. Type ‘\c’ to clear the buffer. 


mysql> 

现在 ， 我 们 有 了 一 个 正在 运行 的 MySQL 版 本 ， 它 已 经 被 限制 为 只 
有 使 用 我 们 设 定 密码 的 root 用 户 才 能 连接 到 数据 库 服 务 器 ， 并 且 这 个 
root 用 户 只 能 从 本 地 机 器 和 连接。 我 们 还 可 以 在 命令 行 上 提供 密码 以 连 
fe 到 MySQL 。 你 可 以 使 用 参数 --password , 如 -- 
password=secretpassword， 或 使 用 -psecretpassword， 但 显然 这 是 不 太 安 
全 的 ， 因 为 密码 可 能 被 ps 命令 或 通过 命令 历史 记录 看 到 。 然 而， 如 果 
你 正在 编写 一 个 需要 连接 到 MySQL 的 脚本 ， 那 么 在 命令 行 上 提供 密码 
又 是 必要 的 。 

下 一 步 是 添加 需要 的 用 户 。 对 于 Linux 系 统 来 说 ， 除 非 绝对 必需 ， 
否则 最 好 使 用 root 账 号 来 登录 MySQL， 所 以 你 应 该 为 日 常 使 用 创建 一 
个 普通 用 户 。 

正如 我 们 之 前 提示 的 ， 你 可 以 针对 不 同 的 机 怖 来 创建 用 户 ， 并 给 
他 们 分 配 不 同 的 连接 权限 。 特 别 地 ， 出 于 安全 考虑 ， 我 们 只 允许 root 
用 户 通过 本 地 机 峰 和 连接。 在 本 章 中 ， 我 们 将 创建 一 个 拥有 相当 广泛 权 
限 的 新 用 户 rick。rick 将 能 使 用 3 种 不 同 的 方法 进行 连接 。 

o 从 本 地 机 器 连接 。 

O 从 了 地 址 在 192.168.0.0 一 192.168.0.255 范 围 内 的 任何 机 器 连 

接 。 


口 、 从 wiley.com 域 中 的 任何 机 器 连接 。 


最 安全 最 简单 的 方法 是 创建 3 个 不 同 的 用 户 ， 他 们 分 别 从 3 个 不 同 
的 地 点 进行 连接 。 如 果 愿 意 ， 我 们 甚至 可 以 根据 他 们 从 何 处 连接 给 他 
们 分 别 设置 3 个 不 同 的 密码 。 

我 们 通过 使 用 grant 命 令 来 创建 用 户 并 赋予 权限 。 这 里 ， 我 们 使 用 
上 面 列 出 的 3 个 不 同 的 连接 起 点 来 创建 用 户 。IDENTIFIED BY 是 一 个 
有 点 古怪 的 设 定 初始 密码 的 语法 。 请 注意 引号 的 使 用 方法 ， 如 下 面 显 
示 的 那样 正确 使 用 单 引 号 是 很 重要 的 ， 否 则 我 们 将 不 能 按照 我 们 期 望 
的 那样 创建 用 户 。 

以 root 用 户 身 份 连接 到 MySQL， 然 后 依次 执行 如 下 操作 。 

(1) 为 rick 创 建 一 个 本 地 登录 : 


I GRANT ALL ON *.* TO rick@localhost IDENTIFIED BY 'secretpassword'; 


(2) 然后 创建 一 个 来 自 C 类 子 网 192.168.0 的 登录 。 注 意 ， 我 们 必 
须 用 单 引 号 来 保护 IP 苑 围 ， 并 使 用 手 码 /255.255.255.0 来 确定 允许 的 IP 
地 址 范围 


GRANT ALL ON *.* TO rick@'192.168.0.0/255.255,255.0' IDENTIFIED BY 
'secretpassword'; 


cm OK, 0 rows affected (0.00 sec) 
(3) 最 后 ， 创 建 一 个 登录 ，i 让 上 rick 能 从 wiley.com 域 中 的 任何 机 器 
登录 (同样 也 需要 注意 单 引 号 的 使 用 ) : 


11> GRANT ALL ON *.* TO rick@’%.wiley.com’' IDENTIFIED BY 'secretpassword'; 


“(4) 现在 我 们 再 次 查看 user 表 来 核对 条 目 : 


tl» SELECT user, host, password FROM mysql.user; 


当然 ， 你 需要 调整 上 面 的 命令 和 密码 来 适应 你 的 本 地 配置 。 你 将 
注意 到 ， 我 们 使 用 的 是 GRANT ALLON *.* 命 令 ， 正 如 你 可 能 猜测 的 
那样 ， 这 给 了 用 户 rick 非 常 广泛 的 权限 。 对 于 权力 很 大 的 用 户 这 样 做 
当然 很 好 ， 但 是 对 于 创建 受 限 用 户 束 不 适用 了 。 我 们 将 在 本 章 的 8.2.2 
人 。 在 那里 ， 我 们 将 讲解 如 何 创建 一 个 受 限 


至 此 我 们 已 经 安装 并 运行 了 MySQL (如 果 还 没有 ， 请 阅读 下 一 
节 ) ， 提 高 了 服务 器 的 安全 性 ， 并 且 创 建 了 一 个 非 root 用 户 来 准备 完 
成 一 些 工 作 。 接 下 来 我 们 将 首先 讨论 安装 后 的 故障 修复 ， 然 后 回 过 头 
来 快速 地 浏览 一 下 MySQL 数 据 库 管 理 的 要 素 o 


8.1.3 : 、 


如 果 使 用 mysql 进 行 连 接 失 败 ， 你 可 以 使 用 系统 的 ps 命令 来 检查 服 
务 絮 进程 是 否 正 在 运行 。 如 果 不 能 在 ps 命令 的 输出 列表 中 找到 它 ， 则 
可 以 笑 斌 执行 命令 mysql_safed-log。 它 会 将 一 些 额 外 信息 写 入 位 于 
MySQL 日 志 目 录 中 的 文件 。 还 可 以 党 试 直接 启动 mysqld 进 程 ， 也 可 以 
使 用 命令 mysqld--ver-bose--help 以 获得 完整 的 命令 行 选项 列表 。 

也 有 可 能 是 服务 器 正在 运行 ， 但 却 拒绝 了 你 的 连接 。 如 有 果 是 这 
样 ， 下 一 个 需要 检查 的 就 是 数据 库 是 否 存在 ， 特 别 是 默认 的 MySQL 权 
限 数据 库 是 否 存 在 。Red Hat 发 行 版 通常 默认 使 用 的 数据 库 目 录 
是 /varlib/mysql， 但 其 他 发 行 版 可 能 使 用 不 同 的 目 隶 位置。 请 检查 
MySQL 的 启动 脚本 (例如 ， 在 /etc/init.d 目 录 中 ) 和 配置 文 
件 /etc/my.cnf 来 找到 数据 库 目 录 位 置 ， 你 也 可 以 使 用 mysqld-verbose - 
help 命 令 直 接 调 用 mysqld 程 序 ， 并 查找 命令 输出 中 的 变量 datadir 来 找到 
数据 库 目 录 位 置 。 一 旦 你 找到 了 数据 库 目 录 ， 请 确认 它 至 少 包 含 一 个 
默认 的 权限 数据 库 ( 称 为 mysql) ， 并 且 服 务 器 守护 进程 正在 使 用 这 个 
位 置 “通过 文件 my.cnf 来 指定 ) e 

如 宁 你 还 是 无 法 连接 ， 请 使 用 服务 编辑 器 停止 服务 器 ， 检 查 并 确 
认 已 没有 mysqld 进 程 正在 运行 ， 然 后 重启 服务 器 并 再 次 尝试 连 授 。 如 
果 这 样 做 你 还 是 无 法 连接 ， 你 可 以 尝试 完全 凶 载 MySQL 并 重新 安装 
它 。MySQL 网 站 上 的 MySQL 文 档 也 是 非常 有 用 的 资源 〈 它 总 是 比 本 
地 的 手册 页 要 新 ， 而 且 它 还 会 包含 一 些 用 户 编辑 的 提示 和 建议 以 及 一 
个 论坛 ) ， 你 可 以 通常 浏览 该 文档 来 找到 一 些 更 深层 次 的 信息 。 


8.2 ”MySQL 管理 
包含 在 MySQL 发 行 版 中 的 一 些 有 用 由 工具 程序 使 省 理 工作 变 得 相 


当 容 易 。 它们 中 最 入 用 的 十 mysqladmin 程 序 。 我 们 将 在 本 市 中 介绍 这 
个 程序 以 及 其 他 一 些 工 具 


8.2.1 命令 


除 mysqlshow 命 命令 以 外 ， 所 有 的 MySQL 命 令 都 接受 表 8-1 所 示 的 3 
个 标准 参数 。 


aj 密码 放 在 命令 行 上 ， 因 为 它 可 以 被 ps 


A 
命令 


1. myisamchk 命 令 


myisamchk 工 具 是 设计 用 来 检查 和 修复 使 用 默认 MYISAM 表 格式 
的 任何 数据 表 ， MYISAM 表 格式 由 MySQL Exe OBI BU, 
myisamchk 应 该 以 安装 时 创建 的 mysql 用 户 吴 份 来 运行 ， 并 且 运 行 该 命 
令 时 应 该 位 于 数据 表 所 处 的 目 孙 中 。 为 了 检查 数据 库 ， 首 先 执行 命令 
sumysql， 然 后 改变 目录 到 与 数据 库 名 称 对 应 的 目录 下 ， 使 用 表 8-2 中 
推荐 的 一 个 或 多 个 选项 来 运行 myisamchk。 例 如 : 

myisamchk -e -r *.MYI 

myisamchk 最 常见 的 命令 选项 见 表 8-2。 


表 8-2 


为 获得 更 多 信息 ， 我 们 可 以 不 市 任何 参数 的 调用 myisamchk 命 令 
以 查看 更 多 的 帮助 信息 。 这 个 工具 对 InnoDB 类 型 的 数据 表 没有 效果 。 


2. mysql 命 令 


这 是 MySQL 一 个 主要 的 且 功 能 非常 强大 的 命令 行 工具 。 儿 乎 每 个 
管理 或 用 户 级 别 的 任务 都 可 以 在 这 里 执行 。 你 可 以 从 命令 行 局 动 
mysql， 通 过 在 命令 行 的 最 后 添加 数据 库 名 称 作 为 参数 ， 你 就 无 需 在 
MySQL 的 控制 台中 使 用 use <database> 命 令 。 例 如 ， 以 用 户 名 rick、 提 
示 输 入 密码 (注意 -p 参 数 后 面 有 一 个 空格 ) 、 默 认 使 用 数据 库 foo 来 局 
动 控 制 台 的 命令 如 下 所 示 : 

$ mysql -u rick -p foo 

你 可 以 使 用 mysql -help | less 命 令 来 逐 页 查看 mysql 控 制 台 的 其 他 命 
令 行 选项 列表 。 

如 果 在 局 动 MySQL 时 未 指定 数据 库 ， 你 可 以 在 MySQL 中 使 用 use 
es ean 正如 表 8-3 的 命令 列表 显示 的 
那样 。 

另外 ， 你 还 可 以 通过 非 区 互 模式 来 运行 mysql， 只 需 捆绑 命令 到 一 
个 输入 文件 中 并 从 命令 行 读 取 它 即 可 。 在 这 种 情况 下 ， 你 必须 在 命令 
行 上 指定 密码 : 

$ mysql -u rick --password=secretpassword foo < sqlcommands.sql 

一 旦 mysql 读 取 并 处 理 完 命令 ， 它 就 将 返回 到 命令 提示 符 。 

当 mysql 客 户 端 连接 到 服务 絮 后 ， 除 了 标准 的 SQL92 命 令 集 以 外 ， 
还 有 一 些 特定 的 命令 也 会 被 mysql 文 持 ， 如 表 8-3 所 示 。 


表 8-3 
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这 个 命令 集中 一 个 非常 重要 的 命令 是 use。mysqld 服 务 器 文 持 同 时 
拥有 许多 不 同 的 数据 库 这 一 想法 ， 所 有 的 数据 库 都 由 同一 个 服务 器 进 
程 来 服务 和 管理 。 许 多 其 他 数据 库 服 务 器 ， 如 Oracle 和 Sybase， 使 用 术 
语 schema (JZ) ， 而 MySQL 最 经 常 使 用 的 术语 是 database (MySQL 
查询 浏览 器 使 用 的 是 术语 schema) 。 每 个 数据 库 (在 MySQL 的 术语 
H) 都 是 一 个 基本 独立 的 表格 集 。 这 使 得 你 可 以 针对 不 同 的 目的 建立 
不 同 的 数据 库 ， 并 为 每 个 数据 库 指 定 不 同 的 用 户 ， 而 只 需要 使 用 同一 
个 数据 库 服 务 器 就 可 以 有 效 地 管理 它们 了 。 只 要 拥有 适当 的 权限 ， 你 
束 可 以 通过 使 用 use 命 令 在 不 同 的 数据 库 之 间 进 行 切 换 。 

特定 数据 库 mysql 是 由 MySQL 安 装 目 动 创建 的 ， 它 用 于 保存 如 用 
户 和 权限 这 样 的 数据 。 


SQL92 是 使 用 最 广泛 的 一 个 ANSI SQL 标准 版 本 。 它 为 SQL 数 
式 、 不 同 数据 库 产品 之 间 的 互 控 作 和 通信 创建 一 臻 
WB o 


3. mysqladmin 


是 快速 进行 MySQL 数据 库 管理 的 主要 工具 。 除 了 常见 的 参数 以 
还 支持 如 表 8-4 所 示 的 命令 。 


X 8-4 


这 
É 


A 


/;«MySQLM f 


如 采 不 市 参数 调用 mysqladmin 命 令 ， 我 们 束 可 以 从 命令 提示 符 下 
看 到 完整 的 选项 列表 。 你 也 许 想 使 用 | less 来 分 页 显示 。 


4. mysqlbug 


如 有 果 运 气 好 的 话 ， 你 将 不 会 有 机 会 使 用 这 个 命令 。 顾 名 思 义 ， 这 
个 工具 生成 一 个 用 于 发 送 给 MySQL 维 护 者 的 错误 报告 。 在 发 送 它 之 


ag 


前 ， 你 可 能 布 望 编辑 生成 的 文件 以 提供 对 开发 者 可 能 有 用 的 其 他 信 


cI 


5. mysqldump 


这 是 一 个 极其 有 用 的 工具 ， 它 允许 你 以 SQL 命令 集 的 形式 将 部 分 
或 整个 数据 库 导 出 到 一 个 单独 文件 中 ， 该 文件 能 被 重新 导入 MySQL 或 
其 他 的 SQL RDBMS。 它 接受 标准 用 户 和 密码 信息 作为 参数 ， 也 接受 
数据 库 名 和 表 名 作为 参数 。 表 8-5 中 列 出 的 其 他 选项 大 大 扩展 了 这 个 工 

HE ^ 


默认 情况 下 ，mysqldump 将 数据 发 送 到 标准 输出 ， 而 你 一 般 都 是 
硕 望 把 它 重 定 回 到 文件 。 

这 个 工具 对 于 迁移 数据 或 快速 备份 非常 有 用 。 此 外 ， 由 于 MySQL 
的 客户 端 服 务 右 实现 方式 ， 通 过 使 用 一 个 安装 在 不 同 机 妖 上 的 
mysqldump 客 户 端 ， 它 甚至 可 以 用 来 实现 远程 备份 。 下 面 这 个 例子 显 
示 了 通过 用 户 名 rick 进 行 连接 ， 转 储 数 据 库 myplaydb 的 例子 : 
，myplaydb 数 据 库 中 只 有 一 个 表 ， 结 果 文 件 如 下 

ZN: 


6. mysqlimport 


mysqlimport 命 令 用 于 批量 将 数据 导入 到 一 个 表 中 。 通 过 使 用 
mysqlimport， 你 可 以 从 一 个 输入 文件 中 读 取 大 量 的 文本 数据 。 这 个 命 
令 唯 一 的 参数 需求 是 一 个 文件 名 和 一 个 数据 库 名 。mysqlimport 将 把 数 
据 导入 到 数据 库 中 与 文件 名 (不 包括 任何 文件 扩展 名 ) 相同 的 表 中 。 
你 必须 确认 文本 文件 与 将 要 填 入 数据 的 表 拥 有 相同 的 列 数 ， 并 且 数 据 
类 型 是 兼容 的 。 在 默认 情况 下 ， 数 据 应 以 tab 分 隅 符 分 开 。 正 如 我 们 前 


面 提 到 的 那样 ， 我 们 也 可 以 通过 一 个 文本 文件 来 执行 SQL 命令 ， 只 需 
运行 mysql 命 令 ， 并 将 输入 重 定向 到 一 个 文件 即 可 。 


7. mysqlshow 
这 个 小 工具 能 够 让 你 快速 了 解 MySQL 安 装 及 其 组 成 数据 库 的 信 


不 提供 参数 ， 它 列 出 所 有 可 用 的 数据 库 。 

以 一 个 数据 库 为 参数 ， 它 列 出 该 数据 库 中 的 表 。 

以 数据 库 和 表 名 为 参数 ， 它 列 出 表 中 的 列 。 

以 数据 库 、 表 和 列 为 参数 ， 它 列 出 指定 列 的 详细 信息 。 


8.2.2 ”创建 用 户 并 赋予 权限 


作为 MySQL 管 理 员 ， 最 常见 的 工作 歼 是 维护 用 户 信息 在 
MySQL 中 添加 和 删除 用 户 并 管理 他 们 的 权限 。 从 MySQL 3.22 开 始 ， 
我 们 可 以 通过 在 MySQL 控 制 台中 使 用 grant 和 revoke 命 令 来 管理 用 户 权 
限 与 在 以 前 版 本 中 必须 通过 直接 编辑 特权 表 来 管理 用 户 相 比 ， 这 
项 任务 变 得 轻松 了 很 多 。 


1. grant 


MySQL 的 grant 命 令 几乎 完全 遵循 SQL92 的 语法 ， 尽 管 不 是 非常 严 
格 。 它 的 常规 格式 是 : 


口 口 口 口 


可 以 授予 的 特权 值 如 表 8-6 所 示 。 
表 8-6 


一 些 命 令 还 有 其 他 选项 。 例 如 ，create view 授 予 用 户 创建 视图 的 
权限 。 要 想 了 解 最 权威 的 权限 列表 ， 请 查阅 MySQL 版 本 的 文档 ， 因 为 
每 一 个 新 的 MySQL 版 本 都 会 对 这 一 领域 进行 扩展 。 还 有 一 些 特殊 的 管 
理 权 限 ， 但 我 们 在 这 里 并 不 关注 它们 。 

授予 特权 的 对 象 被 标识 为 : 

databasename.tablename 
在 Linux 传 统 中 ，* 代 表 的 是 通配符 ， 因 此 *.* 代 表 每 个 数据 库 中 的 每 个 
对 象 ， 而 foo.* 代 表 数 据 库 foo 中 的 每 个 表 o 

如 果 指 定 的 用 户 已 经 存在 ， 他 的 特权 会 被 编辑 以 反映 你 所 做 的 修 
改 。 如 果 该 用 户 不 存在 ， 他 束 会 以 指定 的 特权 被 创建 。 正 如 你 前 面 看 
到 的 那样 ， 用 户 可 以 被 指定 为 来 自 某 个 特定 的 主机 。 你 应 该 在 同一 个 
命令 中 同时 指定 用 户 和 主机 ， 以 便 灵 活 获 得 MySQL 权 限 配置 。 

在 SQL 语法 中 ， 特 殊 字 符 % 代 表 通 配 符 ， 它 与 shell 环 境 中 * 号 的 作 
用 完全 一 样 。 你 当然 可 以 为 每 个 期 望 的 特权 使 用 单独 的 命令 ， 但 是 如 
果 你 想 授 予 用 户 rick 从 wiley.com 域 中 任何 主机 访问 的 权限 ， 可 以 把 rick 
搬 述 为 : 

rick@ ‘%.wiley.com’ 


si 任何 时 候 使 用 % 通 配 符 都 必须 把 它 放 在 引号 中 ， 以 与 其 他 文本 分 


你 还 可 以 使 用 IP/ 网 络 掩 码 标识 (N.N.N.N/M.M.M.M) 来 为 访问 控 
制 设置 一 个 网 络 地 址 。 

正如 我 们 之 前 使 用 rick@“ 192.168.0.0/255.255.255.0’ 来 授予 rick 从 
本 地 网 络 中 任何 机 器 连接 的 特权 那样 ， 我 们 也 可 以 指定 
rick(2*192.168.0.1' 来 将 rick 的 访问 限制 到 一 台 工 作 站 ， 或 指定 rick@ 
“192.0.0.0/255.0.0.0: 来 扩大 范围 以 包括 192 这 个 A 类 网 络 中 的 所 有 机 
at 


下 面 是 另外 一 个 例子 : 

mysql» GRANT ALL ON foo.* TO rick@ * %’ IDENTIFIED BY 
‘bar’; 
这 将 创建 用 户 rick， 他 拥有 对 数据 库 foo 的 所 有 权限 ， 并 能 以 初始 密码 
bar 从 任何 机 器 进行 连接 。 

如 果 数 据 库 foo 尚 未 存在 ， 那 么 用 户 rick 现 在 将 拥有 使 用 SQL 命令 
create database 来 创建 该 数据 库 的 权限 9 

IDENTIFIED BY 子 句 是 可 选 的 ， 但 在 创建 用 户 的 同时 最 好 确保 他 
们 都 设置 有 密码 。 

你 需要 格外 小 心 在 用 户 名 、 主 机 名 或 数据 库 名 中 包含 下 划 线 的 情 
况 ， 因 为 SQL 中 的 下 划 线 是 一 种 匹配 任意 单个 字符 的 模式 ， 这 与 % 匹 


配 一 个 字符 串 非 常 类 似 。 因 此 只 要 有 可 能 ， 请 尽量 不 要 在 用 户 名 和 数 
据 库 名 中 包含 下 划 线 。 

一 般 来 说 ，with grant option 只 会 用 于 创建 二 级 管理 员 。 但 是 ， 它 
也 可 以 用 于 允许 一 个 新 创建 的 用 户 将 授予 他 的 特权 赠 予 其 他 用 户 。 所 
以 请 始终 谨慎 地 使 用 with grant option ° 


2. revokef 4 


当然 ， 管 理 员 不 仅 可 以 授予 用 户 权 限 ， 同 样 也 能 够 乔 寺 用 户 权 
限 。 这 是 通过 revoke 命 令 来 完成 的 : 

revoke <a_privilege> on <an_object> from <a_user> 

这 与 grant 命 令 的 格式 极其 相似 。 例 如 ， 

mysql> REVOKE INSERT ON foo.* FROM rick@‘%’; 

但 是 ，revoke 命 令 不 能 删除 用 户 。 如 果 想 要 完全 删除 一 个 用 户 ， 
不 要 只 是 修改 他 们 的 权限 ， 而 应 用 revoke 来 删除 他 们 的 权限 。 然 后 ， 
你 就 可 以 切换 到 内 部 的 mysql 数 据 库 ， 通 过 从 user 表 中 删除 相应 的 行 来 
完全 删除 一 个 用 户 : 

mysql> use mysql 

mysql> DELETE FROM user WHERE user = “rick” 

mysql> FLUSH PRIVILEGES; 

ALAA TSE ESL, Arosa] et n] DLE CRM BR T EAEE RY 
MySQL 用 户 (在 本 例 中 是 rick) 的 每 个 实例 。 在 完成 了 这 个 之 后 ， 请 
一 定 要 返回 你 自己 的 数据 库 (使 用 use 命 令 ) ， 否 则 你 仍然 在 MySQL 
目 己 的 内 部 数据 库 中 。 


请 理解 delete 与 grant 和 revoke 并 不 属于 同一 范畴 。 由 于 MySQL 
处 理 权 限 方 式 的 需要 ， 这 里 的 SQL 语法 是 必需 的 。 你 是 通过 直接 
更 新 MySQL 的 权限 表 (因此 首先 调用 命令 use mysql) 来 有 效 地 
完成 修改 的 。 

在 更 新 表 之 后 ， 你 必须 使 用 命令 FLUSH PRIVILEGES 来 告诉 
它 需 要 重 载 它 的 权限 表 ， 正 如 上 面 例子 中 显示 的 


8.2.3 ”密码 


如 有 果 想 为 尚未 拥有 密码 的 用 户 指定 密码 ， 或 者 希望 改变 目 己 或 别 
人 的 密码 ， 你 区 需要 以 root 用 户 身 份 连接 到 MYSQL 服务 做 ， 然 后 直接 


更 新 用 户 信 息 。 例 如 : 
mysql> use mysql 
mysql> SELECT host, user, password FROM user; 
你 会 得 到 如 下 的 一 个 列表 : 


十 一 一 一 一 一 一 一 一 一 一 一 + 一 一 一 一 一 一 一 一 一 一 + 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 
| host | user | password 

十 一 一 一 一 一 一 一 一 一 一 一 + 一 一 一 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 - 
| localhost | root | 67457e226alal5bd | 
| localhost | foo | 

十 一 一 一 一 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 + 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 


2 rows in set (0.00 sec) 

如 果 想 给 用 户 foo 指 定 密 码 bar， 则 可 以 这 样 做 : 

mysql> UPDATE user SET password = password ( ‘bar’ ) 
WHERE user = ‘foo’; 

再 次 显示 user 表 中 的 相关 列 : 


mysql> SELECT host, user, password FROM user; 


——— — d m m m 


passworaà 


———————— eT ee tt 


很 显 然 ， 用 户 fo 现在 有 一 个 密码 了 “请 不 要 高 记 返回 你 原先 的 
Æ o 

从 MySQL 4.1 开 始 ， 密 码 机 制 已 经 被 更 新 过 了 。 但 是 ， 考 虚 到 问 
后 兼容 性 ， 你 仍然 可 以 使 用 函数 OLD_PASSWORD (‘要 设置 的 密 
码 ') 来 通过 老 的 算法 设 定 密码 。 


8.2.4 创建 数 据 库 


下 一 步 工作 就 是 创建 数据 库 。 假 设 你 想 要 一 个 名 为 rick 的 数据 
库 ， 还 记得 你 已 用 同样 的 名 字 创 建 了 一 个 用 户 。 首 先 ， 需 要 授予 用 户 
rick 广 泛 的 权限 以 允许 他 创建 新 的 数据 库 。 这 样 做 对 一 个 开发 系统 尤 
其 有 用 ， 因 为 它 可 以 让 用 户 有 更 大 的 灵活 性 。 

mysql> GRANT ALL ON *.* TO rick@localhost IDENTIFIED 
BY ‘secretpassword’; 


现在 以 rick 用 户 喘 份 登录 并 创建 数据 库 来 测试 权限 设置 : 


$ mysql -u rick -p 
Enter password: 


mysql> CREATE DATABASE rick; 

Query OK, 1 row affected (0.01 sec) 

mysql> 

告诉 MySQL 我 们 想 使 用 新 的 数据 库 : 

mysql> use rick 

现在 ， 你 可 以 回 数据 库 中 添加 你 想 要 的 表 和 信息 了 。 在 以 后 的 登 
2 UE ea NE a ae eae Meee 


$ mysql -u rick -p rick 
在 按照 提示 输入 密码 之 后 ， 作 为 连接 过 程 的 一 部 分 ， 在 默认 情况 
下 ， 你 将 目 动 切换 到 使 用 数据 库 rick。 


8.2.5 型 


现在 ， 你 有 了 一 个 可 以 运行 的 MySQL 服 务 器 、 一 个 安全 的 用 户 登 
孙 和 一 个 准备 好 使 用 的 数据 库 。 接 下 来 需要 做 什么 呢 ? 你 需要 创建 一 
些 包 含 列 的 表 来 保存 数据 。 但 是 ， 在 此 之 前 ， 你 需要 了 人 解 MySQL 支 持 
的 数据 类 型 。 

MySQL 的 数据 类 型 非常 标准 ， 因 此 在 这 里 我 们 将 仅仅 简要 地 浏览 
主要 的 类 型 。 一 如 往常 ，MySQL 网 站 上 的 MySQL 手 册 对 此 进行 了 更 
为 详细 的 讨论 。 


1. 布尔 类 型 


可 以 用 关键 字 BOOL 来 定义 布尔 列 。 正 如 你 所 期 望 的 那样 ， 它 将 
持 有 TRUE 和 FALSE 值 。 它 也 可 以 持 有 特殊 的 数据 库 “ 未 知 ” 值 NULL © 


2. 字符 类 型 
如 表 8-7 所 示 ， 有 多 种 字符 类 型 可 供 选 择 。 前 3 个 是 标准 的 ， 后 3 个 


征 MySQL 特 有 的 。 我 们 建议 在 满足 实际 使 用 要 求 的 前 握 下 ， 尽 量 坚持 
使 用 标准 类 型 。 


表 8-7 
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3. 数值 类 型 
数值 类 型 分 为 整 型 和 浮 点 型 ， 如 表 8-8 所 示 。 
表 8-8 
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一 般 情况 下 ， 我 们 建议 你 坚持 使 用 INT、DOUBLE 和 NUMERIC 类 
型 ， 因 为 它们 最 接近 于 标准 的 SQL 类 型 。 其 他 类 型 是 非 标准 的 ， 如 果 
你 将 来 需要 移动 数据 ， 其 他 数据 库 系 统 中 可 能 不 支持 这 些 类 型 。 

4. 时 间 类 型 

有 5 种 时 间 数 据 类 型 可 供 使 用 ， 如 表 8-9 所 示 。 


表 8-9 


= x i m 

DATE 在 鳍 从 1000 年 1 月 1 日 -9999 年 12 月 431 日 之 各 的 日 期 
M FE EE M. R38:59-59-838:59:592* D 0M fi] 
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在 鱼 从 1000 年 1 月 1 日 -9999 年 12 月 31 卓 最 后 一 可 之 癌 的 日 晶 
PARES ERARE BAER, WAARD 6s 


请 注意 ， 当 比较 DATE 和 DATETIME 值 以 了 解 时 间 部 分 是 如 何 处 
理 的 时 候 ， 你 需要 格外 小 心 ， 你 可 能 会 看 到 非 期 望 的 结果 。 详 细 信息 
请 查阅 MySQL 的 手册 ， 因 为 不 同 版 本 的 MySQL 其 行为 稍 有 不 同 。 


8.2.6 BJEK 


至 此 ， 你 已 运行 了 数据 库 服务 器 ， 了 解 了 如 何 分 配 用 户 权 限 以 及 
ee 

一 个 数据 库 表 只 不 过 是 一 系列 的 行 ， 而 每 行 又 由 固定 数目 的 列 组 
成 。 它 非常 像 电 子 表格 ， 除 了 每 行 都 必须 包含 相同 数目 和 类 型 的 列 ， 
而 且 每 行 必须 以 某 种 方式 不 同 于 表 中 的 其 他 行 。 

只 要 合乎 情理 ， 一 个 数据 库 可 以 包含 的 表格 数 是 不 受 限 制 的 。 但 
是 ， 很 少 有 数据 库 需 要 100 个 以 上 的 表 ， 对 于 大 多 数 小 系统 来 说 ，25 个 
左右 的 表 通 常 就 足够 了 。 

创建 数据 库 对 象 的 完整 SQL 语法 被 称 为 DDL (data definition 
language， 数 据 定义 语言 ) 。 它 相当 复杂 ， 要 想 在 一 章 的 内 容 中 全 面 
人 
X Tv o 

创建 表 的 基本 语法 是 : 

CREATE TABLE <table name» ( 

column type [NULL | NOT NULL] [AUTO_INCREMENT] 
[PRIMARY KEY] 

L ...] 

[, PRIMARY KEY (colum [, ... ])] 


) 

你 可 以 用 DROP TABLE 语 法 来 删除 表 ， 这 非常 简单 : 

DROP TABLE <table name> 

束 目 前 而 言 ， 你 仅 需 要 了 解 少 数 几 个 关键 字 束 可 以 完成 表 的 快速 
创建 了 ， 这 几 个 关键 字 如 表 8-10 所 示 。 
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实 验 创建 表 并 添加 数据 
观看 实践 中 表 的 创建 要 比 学 习 基 本 语法 简单 得 多 ， 所 以 现在 让 我 
们 来 创建 一 个 名 为 children 的 表 。 它 将 为 每 个 孩子 存储 一 个 唯一 的 数 
字 、 名 和 年 龄 。 我 们 把 孩子 的 编号 作为 主键 。 
(1) 你 需要 的 SQL 命令 是 : 


CREATE TABLE children 

childno INTEGER AUTO INCREMENT NOT NULL PRIMARY KEY, 
fname VARCHAR(30] 

age INTEGER 


注意 ， 与 大 多 数 程序 设计 语言 不 同 ， 列 名 (childno) 出 现在 
列 数据 类 型 (INTEGER) 之 前 。 


《2) 你 还 可 以 使 用 另外 一 种 语法 将 列 定 义 和 主 键 定 义 分 开 ， 下 面 
的 交互 式 会 话 显 示 了 这 一 语法 : 
mysql> CREATE table children ( 
» childno INTEGER AUTO INCREMENT NOT NULL, 
» fname varchar(30), 


age INTEGER, 
» PRIMARY KEY(chíldno) 


请 注意 我 们 是 如 何 跨 越 多 行 输入 SQL 语句 的 ，MySQL 用 -> 提示 符 
来 表示 我 们 位 于 延续 的 行 上 。 同 样 请 注意 ， 正 如 我 们 之 前 提 到 的 那 
样 ， 我 们 使 用 分 号 结束 SQL 命令 ， 表 示 我 们 已 经 完成 输入 并 准备 好 让 
数据 库 处 理 请 求 了 。 

如 果 出 现 了 错误 ，MySQL 人 允许 回 退 到 之 前 的 命令 ， 编 辑 它 并 通过 
按 下 回 车 键 重新 输入 它 。 

(3) 现在 可 以 向 表 中 添加 数据 了 。 我 们 使 用 SQL 命 令 INSERT 来 

添加 数据 。 因 为 我 们 定义 childno 列 为 AUTO_INCREMENT 列 ， 所 以 不 
需要 为 此 列 提供 数据 ， 我 们 只 需 让 MySQL 分 配 一 个 唯一 的 数字 。 


myag INSERT INTO children (fname, age) VALUES("Jenny*, 21); 


mysql> INSERT INTO children(fname, age) VALUES(*Andrew*, 17); 


r sae SELECT 从 表 中 提取 数据 来 检查 数据 是 否 被 正确 添 
[1 


| SELECT childno, fname, age FROM children; 


与 明确 的 列 出 我 们 想 选 择 的 列 相 比 ， 你 也 可 以 使 用 星 号 (*) 代表 
列 ， 这 将 列 出 表 中 的 所 有 列 。 这 对 交互 式 的 使 用 会 很 方便 ， 但 在 产品 
代码 中 ， 你 应 该 始终 明确 地 指定 你 想 要 选择 的 列 o 

实验 解析 

你 启动 了 一 个 对 数据 库 服 务 器 的 交互 式 会 话 ， 并 切换 到 rick 数 据 
库 。 然 后 ， 你 输入 SQL 命令 创建 表 ， 使 用 满足 需要 的 行 来 创建 列 。 一 
旦 使 用 分 号 结束 了 SQL 命令 ，MySQL 就 将 创建 表 。 使 用 INSERT 语 名 
添加 数据 到 新 表 中 ， 人 允许 childno 列 被 自动 分 配 数字 。 最 后 ， 使 用 
SELECT 来 显示 表 中 的 数据 。 

我 们 在 本 章 中 没有 足够 的 篇 幅 来 介绍 SQL 的 所 有 细节 ， 更 不 用 说 
讨论 数据 库 设 计 了 。 关 于 SQL 的 更 多 信息 请 访问 www.mysql.com。 


8.2.7 乡 化 工 


" eoo 中 操作 表 和 数据 是 很 好 ， 但 是 如 今 很 多 人 更 喜欢 使 用 
EPLIR ° 

MySQL 有 两 个 主要 的 图 形 化 工具 : MySQL‘ has (MySQL 
Administrator) 和 和 MySQL 查询 浏览 器 (MySQL Query Browser) ° 这 
些 工 具 的 具体 软件 包 名 称 取决 于 你 所 使 用 的 Linux 发 行 版 。 例 如 ， 
RedHat 发 行 版 中 对 应 的 软件 包 和 名称 是 mysql-gui-tools 和 mysql- 
administrator。 对 Ubuntu 来 说 ， 你 可 能 需要 首先 司 用 Universe 库 ， 然 后 
再 查找 mysql-admin ° 


1. MySQL 查 询 浏览 器 


查询 浏览 器 是 一 个 相当 简单、 但 又 很 有 效 的 工具 。 安 装 它 之 后 ， 
你 可 以 通过 GUI 有 菜单 调用 它 。 执 行 它 之 后 ， 你 会 看 到 一 个 登录 窗口 要 
求 你 提供 连接 的 详细 信息 ， 如 图 8-4 所 示 。 

如 果 你 是 在 和 服务 器 同一 台 的 机 器 上 运行 它 ， 你 只 需 在 Server 
Hostname 处 输入 localhost 即 可 ° 


MySQL Query Browser 


~ 


b % 
过 


Mc 
Query Browser 


Connect to MySQL Server Instance 
Stored Connection: | (last connection) 


Server Hostname; {localhost | Port: 3306 $] 


Bee ERB SR, UR a SUI— T iB AGUILAR, 808-5 Air 
示 。 它 允许 你 在 一 个 GUI shell 中 执行 查询 命令 、 提 供 图 形 化 编辑 的 所 
有 优越 性 、 一 个 图 形 化 的 编辑 表格 中 数据 的 方式 和 一 些 针 对 SQL 语 法 
的 帮助 屏幕 。 


MySQL Query Rrowter » rickQlocathost via socket 


fe Edt View Query Script ols MySOL Enterprise Help 
select * from children 


Syntax |puncrions | Params x 
^ — 
v o Data Definition Statements 一 
£4 ALTER DATADASE Syntax — 
£^ ALTER TABLE Syntex 
4 CREATE DATABASE Syntax — 
n 


7 rows fetched in O 00.0620 J Start iting FU Last J 
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2. MySQL 管 理 器 


我 们 强烈 建议 你 符 试 一 下 MySQL 管 理 右 。 它 是 一 个 针对 MySQL 
的 功能 强大 、 稳 定 和 易于 使 用 的 图 形 化 接口 。 它 针对 Linux 和 Windows 
都 提供 了 预 编译 的 版 本 (如 果 你 需要 的 话 ， 它 甚至 还 提供 了 源 代 
码 ) 。 它 允许 你 通过 一 个 GUI 界 面 同时 完成 管理 MySQL 服 务 器 和 执行 
SQL 命 令 的 工作 。 

执行 MySQL 管 理 器 时 ， 你 将 看 到 一 个 与 MySQL 查 询 浏览 器 的 连 
接 窗 口 非常 相似 的 窗口 。 在 输入 详细 信息 之 后 ， 你 将 看 到 一 个 主 控 页 
面 ， 如 图 8-6 所 示 。 


MySQL Administrator root llocaihost via socket 
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- Y Server Status: 
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Ag cer A irettéh Connected to MySQL Server Instance 


User: root 


rj Server Connections Most: localhost 
"à Health Socket: Naro mysaumysat sock 
Gy server Logs Server information 
Gh Backup MySQL Version: SYS SA? 
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ign Restore Backup 
3. Replication Status 


iy Catalogs Version: MySQL Client Version 5.0 37 
Network Name: [cThipde 
IP: 127001 
Operating System: Unux 2.6 21-1 3228 !c7 
Hardware: Intel(R] Pentium R) 4 CPU 2.50GHz 2491.383 MHz, 0.7 68 RAM 
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数据 库 迁 移 工具 。Windows 版 本 的 状态 窗 多国 8 你 可 以 看 到 ， 它 
几乎 和 Linux 版 本 完全 一 样 。 
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请 记 住 ， 如 果 你 一 直 按照 本 章 中 的 要 求 在 做 ， 那 么 你 已 对 
MySQL 服 务 絮 的 安全 进行 了 加 国 ，root 用 户 只 能 从 localhost 进 行 连 
接 ， 而 不 能 从 网 络 中 的 任何 其 他 机 器 进行 连接 。 


一 旦 MySQL 管 理 右 已 运行 了 ， 你 整 可 以 浏览 一 下 它 的 不 同 配 置 和 
监控 选项 。 它 十 一 个 非常 易于 使 用 的 工具 ， 但 我 们 在 本 章 中 没有 足够 
的 篇 幅 来 详细 介绍 它 了 。 


8.3 C 语 言 访问 MySQL 数 据 


至 此 我 们 已 千 握 了 MySQL 的 入 门 知 识 ， 下 面 让 我 们 探 完 一 下 如 何 
通过 应 用 程序 来 访问 MySQL， 而 不 是 使 用 GUI 工具 或 基本 的 mysq] 客 户 
itt ° 

我 们 可 以 通过 许多 不 同 的 编程 语言 来 访问 MySQL， 包 括 : 

C 
C++ 


口 口 口 口 口 口 口 口 


O 
Windows 本 地 程序 (如 Access) 也 可 以 通过 ODBC 驱 动 程序 来 访问 
ey 甚至 还 有 针对 Linux 的 ODBC 张 动 程序 ， 尽 管 我 们 没有 什么 理 
它 o 
在 本 章 中 ， 我 们 将 主要 讨论 C 语 言 接口 ， 因 为 这 是 本 书 的 重点 ， 
而 且 许 多 其 他 语言 也 使 用 相同 的 库 来 建立 连接 。 


8.3.1 ERM 


用 C 语 言 连接 MySQL 数 据 库 包 含 两 个 步骤 : 
Oo 初始 化 一 个 连接 句柄 结构 ; 

口 、 实 际 进行 连接 。 

首先 ， 使 用 mysql_init 来 初始 化 连接 句柄 : 


f include «mysql.h» 


通常 你 传递 NULL 给 这 个 例 程 ， 它 会 返回 一 个 指向 新 分 配 的 连接 
句柄 结构 的 指针 。 如 果 你 传递 一 个 已 有 的 结构 ， 它 将 被 重新 初始 化 。 
这 个 例 程 在 出 错时 返回 NULL 。 

目前 为 止 ， 你 只 是 分 配 和 初始 化 了 一 个 结构 。 你 仍然 需要 使 用 


mysql_real_connect 来 癌 一 个 连接 提供 参数 ; 


MYSQL *mysql real connect (MYSQL ‘connection, 
const char *servor host, 
const char *sqgl user name, 
const char *sql password, 
const char *db name, 
unsigned int port number, 


指针 connection 必 须 指 回 已 经 被 mysqlL_init 初 始 化 过 的 结构 。 其 他 
参数 的 含义 都 相当 明了 ， 但 是 ， 请 注意 server_host 既 可 以 是 主机 和 名， 
也 可 以 是 IP 地 址 。 如 果 只 是 连接 到 本 地 机 器 ， 你 可 以 通过 指定 localhost 
来 优化 连接 类 型 。 

sql_user_name 和 sql_password 的 含义 和 它们 的 字面 含义 一 样 。 如 果 
登录 名 为 NULL， 则 假设 登录 名 为 当前 Linux 用 户 的 登录 ID。 如 果 密 码 
为 NULL， 你 将 只 能 访问 服务 器 上 无 需 密码 就 可 访问 的 数据 。 密 码 会 
在 通过 网 络 传 输 前 进行 加 密 。 

port_number 和 unix_socket_name 应 该 分 别 为 0Oo 和 NULL， 除 非 你 改 
变 了 MySQL 安 装 的 默认 设置 。 它 们 将 默认 使 用 合适 的 值 。 

最 后 ，flags 参 数 用 来 对 一 些 定 义 的 位 模式 进行 OR 操作 ， 使 得 改变 
使 用 协议 的 某 些 特性 。 对 于 像 本 章 这 样 的 介绍 性 章 世 来 说 ， 这 些 标志 
都 没什么 用 处 ， 详 细 的 资料 请 参考 使 用 手册 。 
pnl cm 它 将 返回 NULL ° mysql error Eg Zt n] EL de BUB TD 
E ' EL M 

使 用 完 连 接 之 后 ， 通 第 在 程序 退出 时 ， 你 要 像 下 面 这 样 调用 函数 


mysql_close: 


const char *unix socket name, 
unsigned int flags); 


这 将 关闭 连接 。 如 果 连 接 是 由 mysqlL_init 建 立 的 ，MySQL 结 构 会 
被 释放 。 指 针 将 会 失 殖 并 无 法 再 次 使 用 。 傈 留 一 个 不 需要 的 连接 是 对 
资源 的 浪费 ， 但 是 重新 打开 连接 也 会 带 来 额外 的 开销 ， 所 以 你 必须 目 
己 权衡 何 时 使 用 这 些 选 项 。 

mysql_options 例 程 〈 仅 能 在 mysqlL_init 和 mysql_real_connect 之 间 调 
H) 可 以 设置 一 些 选项 : 


int mysql options (MYSQL *connection, enum option to set, 
const char *argument); 


因为 mysqlL_options 一 次 只 能 设置 一 个 选项 ， 所 以 每 设置 一 个 选项 
束 得 调用 它 一 次 。 你 可 以 根据 需要 多 次 使 用 它 ， 只 要 它 出 现在 
mysql_init 和 mysql_real_connect 之 间 即 可 。 并 不 是 所 有 的 选项 都 是 char 
类 型 ， 因 此 它们 必须 被 转换 为 const char *。 表 8-11 中 列 出 了 3 个 最 常用 
的 选项 。 与 往常 一 样 ， 完 整 的 选项 请 参见 在 线 手册 。 
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numit iA 实际 参数 类 型 a afi 
? t ‘ - 楼 超 对 之 ste 
tione, fli PO IAE Hn (WH LS 


cider 


一 次 成 功 的 调用 将 返回 0。 因 为 它 仅仅 是 用 来 设置 标志 ， 所 以 失败 
总 是 意味 着 使 用 了 一 个 无 效 的 选项 。 
如 有 果 要 设置 连接 超时 时 间 为 7 秒 ， 我 们 使 用 的 代码 片断 如 下 所 示 : 


MYSQL OP JNNECT TIMEOUT 


至 此 你 已 学 会 了 如 何 建立 和 关闭 连接 ， 下 面 我 们 使 用 一 个 简短 的 
程序 来 测试 一 下 。 

首先 为 用 户 设置 一 个 新 的 密码 (在 下 面 的 代码 中 ， 是 本 机 上 的 
rick 用 户 ) ， 然 后 创建 要 连接 的 数据 库 foo。 上 述 工 作对 你 来 说 都 应 该 
很 熟悉 ， 所 以 我 们 将 只 显示 它们 执行 的 顺序 : 


mysql -u root -p 


myg GRANT ALL ON *.* TO rick@localhost IDENTIFIED BY 'secret'; 


mysql» CREATE DATABASE foo; 


现在 你 已 创建 了 新 数据 库 。 如 果 和 直接 在 mysql 命 令 行 中 输入 许多 创 
建 表 和 添加 数据 的 命令 ， 这 比较 容易 出 错 ， 而 且 如 有 果 需 要 再 次 输入 这 
些 命令 的 话 ， 这 种 方法 也 显得 不 够 高 效 。 为 此 ， 你 应 该 创建 一 个 包含 
你 所 需要 命令 的 文件 。 

这 个 文件 为 create children.sql: 


AAAA 
Soe a 
LB 


INTO childrer 
VÀ ^ 


现在 ， 你 可 以 重新 登录 MySQL ， 选 择 数据 库 foo, 并 执行 这 个 文 
件 。 为 简洁 起 见 ， 也 为 了 避免 将 密码 放 入 脚本 中 ， 我 们 将 密码 放 在 了 


> 


S mysql -u rick --passwordssecret foo 
Welcome to the MySQL monito: 5rmands end with 


mysql» V. create children.sqi 
( ry OX rows affected ) 


sery 


时 生成 的 。 现 在 你 有 一 个 用 户 、 一 个 数据 库 和 一 个 保存 了 一 些 数据 的 
表 ， 是 时 候 看 一 下 如 何 通过 代码 来 访问 这 些 数据 了 。 

下 面 是 源 文件 connect1.c， 它 以 用 户 名 rick 和 密码 secret 来 连接 本 机 
服务 右上 名 为 foo 的 数据 库 : 


现在 开始 编译 这 个 程序 。 你 可 能 需要 同时 添加 include 路 径 和 库 文 
件 路 径 ， 以 及 指定 链接 的 库 模 块 mysqlcliento 在 某 些 系统 上 ， 你 可 能 还 
需要 使 用 -1z 选 项 来 链接 压缩 库 。 在 我 的 系统 上 ， 需 要 的 编译 指令 为 : 

(Gem ME eee TAP EXT EL. EN ae ite BUR 
于 你 所 使 用 的 Linux 发 行 版 ， 你 需要 根据 它们 的 位 置 对 上 面 的 编译 行 做 
出 相应 的 调整 。 

运行 它 时 ， 你 只 会 看 到 一 条 连接 成 功 的 信息 : 


> -/connect1 
mnection success 


在 第 9 划 中 ， 我 们 将 演示 如 何 通过 创建 一 个 makefile 文 件 来 将 连接 
程序 的 构建 目 动 化 。 
可 以 看 出 ， 与 MySQL 数 据 库 建 立 连 接 是 很 简单 的 。 


8.3.2 “错误 处 理 


在 我 们 介绍 更 复杂 的 程序 之 前 ， 了 解 一 下 MySQL 如 何 进 行 错误 处 
理 和 是 很 有 用 的 。MySQL 使 用 一 系列 由 连接 句柄 结构 报告 的 返回 码 。 两 
个 必 备 的 例 程 是 : 


unsigned int mysql errno(MYSQL *connection) ; 
和 

char *mysql error(MYSQL *connection); 

你 可 以 通过 调用 mysql_errno 并 传递 连接 结构 来 获得 错误 码 ， 它 通 
常 都 是 非 0 值 。 如 果 未 设 定 错误 码 ， 它 将 返回 90。 因为 每 次 调用 库 都 会 
更 新 错误 码 ， 所 以 你 只 能 得 到 最 后 一 个 执行 命令 的 错误 码 。 但 是 上 面 
列 出 的 两 个 错误 检查 例 程 是 例外 ， 它 们 不 会 导致 错误 码 的 更 新 。 

mysql_errno 的 返回 值 实际 上 就 是 错误 码 ， 它 们 在 头 文件 errmsg.h 
或 mysqld_error.h 中 定义 。 这 两 个 文件 都 可 以 在 MySQL 的 include 目 杂 中 
找到 。 前 者 报告 客户 端 错误 ， 后 者 关注 服务 端 错误 。 

如 有 条 你 更 喜欢 文本 错误 信息 ， 也 可 以 调用 mysqlL_error， 它 提供 了 
有 意义 的 文本 信息 而 不 是 单调 的 错误 码 。 这 些 信息 被 写 入 一 些 内 部 静 
a 所 以 如 果 想 保存 错误 文本 ， 你 需要 把 它 复制 到 别 的 地 


你 可 以 在 代码 中 添加 一 些 基本 的 错误 处 理 来 观察 它们 的 行为 。 你 

可 能 已 经 注意 到 ， 当 调用 mysql_real_connect 时 会 明 到 一 个 问题 ， 因 为 

它 在 失败 时 返回 NULL 指 针 ， 并 没有 提供 一 个 错误 码 。 但 如 果 你 将 连 

为 一 个 变量 ， 那 么 即使 mysql_real_connect 失 败 ， 你 仍然 能 够 
理 它 。 

下 面 是 源 文件 connect2.c， 它 示例 了 如 何 使 用 非 动态 分 配 的 连接 结 

构 ， 以 及 如 何 编写 一 些 基本 的 错误 处 理 代码 。 源 文件 中 修改 的 部 分 以 


阴影 显示 : 


通过 避免 使 用 返回 值 覆 盖 连 接 指针 的 方法 ， 你 可 以 很 容易 地 解决 
mysql_real_connect 失 败 所 市 来 的 问题 。 不 仅 如 此 ， 这 也 是 男 一 种 使 用 


连接 结构 的 好 例 于 。 你 可 以 使 用 一 个 错误 的 用 户 或 密码 来 强制 生成 错 
误 ， 从 而 得 到 类 似 于 mysql 工 具 提 供 的 错误 码 。 


/connect 2 


8.3.3 ”执行 SQL 语句 


你 已 能 够 连接 数据 库 并 正确 处 理 错误 了 ， 现 在 是 时 候 让 程序 做 一 
些 实际 的 工作 了 。 执 行 SQL 语 句 的 主要 API 函 数 被 恰当 的 命名 为 : 


int mysql query (MYSQL *connection, const char *query) 


不 是 太 难 吧 ? 这 个 例 程 接受 连接 结构 指针 和 文本 字符 串 形 式 的 有 
效 SQL 语 句 (没有 结束 的 分 号 ， 这 与 mysql 工 具 不 同 ) 。 如 果 成 功 ， 它 
返回 0。 对 于 包含 二 进 制 数据 的 查询 ， 你 可 以 使 用 第 二 个 例 程 
mysql_real_query， 但 是 在 本 章 中 ， 我 们 将 只 使 用 mysql_query。 

1. 不 返回 数据 的 SQL 语句 

为 简单 起 见 ， 我 们 前 先 来 看 一 些 不 返回 任何 数据 的 SQL 语 句 : 
UPDATE ~ DELETEAIINSERT ° 
m 我 们 将 在 这 里 介绍 男 一 个 重要 函数 ， 它 用 于 检查 受 查 询 影 响 的 行 
3X: 


my ulonglong mysql affected rows(MYSQL *connection); 


你 很 可 能 首先 注意 到 的 是 这 个 函数 的 返回 值 类 型 很 不 常见 。 它 使 
用 无 符号 类 型 是 出 于 移植 性 的 考虑 。 当 你 使 用 printf 时 ， 我 们 推荐 使 
用 %lu 格 式 将 其 转换 为 无 符号 长 整 型 。 这 个 函数 返回 受 之 前 执行 的 
UPDATE 、INSERT 或 DELETE 查询 影 响 的 行 数 。 如 果 你 使 用 过 其 他 
SQL 数据 库 ，MySQL 的 返回 值 可 能 会 让 你 感到 意外 。MySQL 返 回 的 是 
被 一 个 更 新 操作 修改 的 行 数 ， 但 许多 其 他 数据 库 将 仅仅 因为 记录 匹配 
WHERE 子 句 就 把 它 视 为 已 经 更 新 过 。 

通常 对 于 mysqlL_ 系列 函数 ， 返 回 值 0 表 示 没 有 行 受到 影响 ， 正 数 则 
是 实际 的 结果 ， 一 般 表 示 受 语句 影响 的 行 数 。 

首先 ， 你 需要 在 数据 库 foo 中 创建 children 表 (如 果 你 之 前 没有 这 
么 做 的 话 ) 。 删 除 〈 使 用 drop 命 令 ) 任何 已 有 的 表 以 确保 你 有 一 个 整 
洁 的 表 定 义 ， 并 重新 发 送 在 AUTO_INCREMENT 列 中 使 用 的 任何 ID: 


$ mysql -u rick -p foo 
‘oyi> DROP TABLE children; 


mysql> CREATE TABLE children | 
childno int(11) AUTO INCREMENT NOT NULL PRIMARY KEY, 
fname varchar(30), 
age int 
7 
43 affected 


现在 ， 在 connect2.c 源 文件 中 添加 一 些 代码 以 在 表 中 插入 一 个 新 
行 ， 这 个 新 程序 被 命名 为 insert1.c。 需 要 注意 的 是 ， 下 面 代码 中 显示 的 
折 行 是 由 于 物理 页 面 的 限制 ， 你 通常 不 会 在 实际 的 SQL 语句 中 使 用 换 
行 符 ， 除 非 它 是 一 个 非常 长 的 语 铝 。 如 果 是 这 种 情况 ， 你 可 以 在 行 尾 
使 用 \ 字 符 以 允许 SQL 语句 继续 到 下 一 行 。 


@include <stdlib.h> 
tir i " ^ 


© "my 
t main rav 
MYSQL m r 
int re 
zy mr 
NULI 
prinrf(* 
E 
re mypgi .query|&my connection, “INSERT INTO children|fname, age) 
ALUES|'A: 3)* 
if (tres 
printf(*Inserted tlu rowain* 
unsigned long)mysqi affected rowsi&my connection)) 
) else 
fprintf(stderr, *Insert error td: s\n", mysql. .errnol&my connection), 
mysql er (&my con n) 
) 
my 
fprint f 
{ [my rno[&smy conne tior 
I r nne 站 ox 
err nn 


ZENA, RIEA T TTR o 
现在 ， 让 我 们 改变 代码 来 包含 UPDATE 而 不 是 INSERT， 并 且 观 察 
受 影 啊 的 行 是 如 何 被 报告 的 。 


myaql errno lény connection mysql errot 


tprintt (stderr "Update error td: tei", mysql errno(&my connection 
my error(&my connacric 


我 们 将 此 程序 叫做 updatel.c。 它 试图 将 所 有 叫做 Ann 的 孩子 的 年 
龄 设 为 4。 现 在 ， 假 设 children 表 中 有 如 下 数据 ; 


mysql> SELECT * from CHILDREN; 


+--------- + 一 一 一 一 一 一 一 +------ + 
| childno | fname | age | 
$--------- +-------- + 一 一 一 一 一 一 + 
| 1 | Jenny | 21 | 
| 2 | Andrew | 17 | 
| 3 | Gavin | 9 | 
| 4 | Duncan | 6 | 
| 5 | Ema | 4 | 
| 6| Alex | 15 | 
| 7 | Adrian | 9 | 
| 8 | Ann | 3] 
| 9 | anm | 4| 
| 10 | Ann | 3 | 
| 11 | Ann | 4 | 
$--------- 本 一 一 二 一 二 二 二 二 pnra + 


11 rows in set (0.00 sec) 
请 注意 有 4 个 孩子 的 名 字 匹 配 Ann。 如 果 执 行 update1， 你 可 能 会 认 
为 受 影 响 的 行 数 为 4， 这 是 由 WHERE 子 句 匹配 的 行 数 。 但 是 ， 你 会 看 
到 程序 报告 仅 有 2 行 受 影响 ， 这 是 因为 实际 需要 对 数据 进行 修改 的 行 数 


只 有 2 行 。 你 可 以 使 用 mysql_real_connect 的 CLIENT_FOUND_ROWS 标 
志 来 获得 更 传统 的 报告 。 


E > 中 的 数据 ， 然 后 再 运行 程序 ， 它 将 报告 受 影响 
J 行 数 为 4。 

函数 mysql_affected_rows 还 有 最 后 一 个 古怪 之 处 ， 它 出 现在 从 数 
据 库 中 删除 数据 的 时 候 。 如 果 你 使 用 WHERE 子 句 删除 数据 ， 那 么 
mysql_affected_rows 将 返回 你 期 望 的 删除 的 行 数 。 但 如 果 在 DELETE 语 
句 中 没有 WHERE 子 句 ， 那 么 表 中 的 所 有 行 都 会 被 删除 ， 但 是 由 程序 
返回 的 受 影响 行 数 却 为 0。 这 是 因为 MySQL 优 化 了 删除 所 有 行 的 操 
作 ， 它 并 不 是 执行 许多 个 单行 删除 操作 。 这 一 行为 不 会 受 
CLIENT_FOUND_ROWS 选 项 标志 的 影响 。 


2. 发 现 插入 的 内 容 


插入 数据 有 一 个 微小 但 至 关 重 要 的 方面 。 还 记得 我 们 提 过 
AUTO_INCREMENT 类 型 的 列 吗 ? 它 由 MySQL 自 动 分 配 ID。 这 一 特性 
非常 有 用 ， 特 别 是 当 你 有 许多 用 户 的 时 候 。 

让 我 们 再 次 查看 表 的 定义 : 


REATE 
childno INTEGER AUTO INCREMENT NOT NULL PRIMARY KEY 
RCHAR ( 30 


mame VAR 
age INTEGER 


正如 你 看 到 的 那样 ，childno 列 被 设 为 AUTO_INCREMENT 类 型 © 
这 样 当然 很 好 ， 但 是 一 旦 你 插入 一 行 ， 你 如 何 知 道 刚 插入 的 孩子 被 分 
配 了 什么 数字 呢 ? 

你 可 以 执行 一 条 SELECT 语句 来 搜索 孩子 的 名 字 ， 但 这 样 效 率 会 
很 低 ， 并 且 如 果 有 两 个 相同 名 字 的 孩子 ， 这 将 不 能 保证 唯一 性 。 或 
者 ， 如 果 同 时 有 多 个 用 户 快 速 地 插入 数据 ， 那 么 可 能 在 更 新 操作 和 
SELECT 语句 之 间 会 有 其 他 行 被 插入 。 因 为 发 现 一 个 
AUTO_INCREMENT 列 的 值 是 大 家 都 面临 的 一 个 共同 问题 ， 所 以 
MySQL 以 函数 LAST_INSERT_IDO 的 形式 提供 了 一 个 专门 的 解决 方 

无 论 何 时 MySQL 向 AUTO_INCREMENT 列 中 插入 数据 ，MySQL 
都 会 基于 每 个 用 户 对 最 后 分 配 的 值 进行 跟踪 。 用 户 程 序 可 以 通过 
SELECT 专 用 函数 LAST_INSERT_ID() 来 发 现 该 值 ， 这 个 函数 的 作用 有 
点 像 是 表 中 的 虚拟 列 。 


X 验 提取 由 AUTO_INCREMENT 生 成 的 ID 
sau DABIS f AUR Bl Ze PFT LAST_INSERT_IDO ER ZO Æ 


mysql> rel ee rt age) VALUES('TOm', 13); 
query 


ysql» SELECT LAST. INSERT. 1D; 


sql> “INSERT INTO children(fname, eo) VALUES ('Harry’, 17); 


agi» SELECT LAST. mess 1D(); 


实验 解析 

每 次 插入 一 行 ，MySQL 就 分 配 一 个 新 的 id 值 并 且 跟 踪 它 ， 使 得 你 
可 以 用 LAST_INSERT_IDO 来 提取 它 。 

如 果 想 通过 实验 查看 返回 的 数字 在 本 次 会 话 中 确实 是 唯一 的 ， 那 
么 你 可 以 打开 另 一 个 会 话 并 插入 另 一 行 数 据 。 然 后 在 最 初 的 会 话 中 重 
新 执行 SELECT LAST. INSERT IDQ; 语句 。 你 将 看 到 数字 并 没有 发 
生 改 变 ， 这 是 因为 该 语句 返回 的 数字 是 由 当前 会 话 插入 的 最 后 一 个 数 
字 。 但 是 ， 如 果 执 行 SELECT *FROM children， 你 将 看 到 其 他 会 话 确 
实 已 插入 数据 了 。 


x 验 在 C 程 序 中 使 用 自动 分 配 的 ID 

在 本 例 中 ， 我 们 将 修改 insertl.c 程 序 以 查看 这 些 操作 是 如 何在 C 语 
PI ai 。 代码 中 的 关键 修改 将 以 阴影 显示 。 我 们 把 修改 后 的 程序 
命名 为 insert2.c ° 


res = mysql_query(émy_connection, “SELECT LAST_INSERT_ID()* 


if ires) { 
printf ("SELECT error: s\n", mysqi_error(émy_connection)); 
) else { 
res ptr = mysql use resuilt(&my connection]; 
if (res ptr) ( 
while ((sqdlrow = mzysgl fetch rowi(res ptr)]) I 
printfí('We inserted childno *sin*, sqirow[0]); 


mysql free result(res ptr) 


ZINS A 
下 面 是 这 个 程序 的 输出 : 
$ gcc -I/usr/include/mysql insert2.c -L/usr/lib/mysql -imysglclient -o insert2 
$ ./insert2 
annection success 
serted l rows 
We inserted chiildno 6 


; Pere 


erted i TOWS 


We inserted childno 


实验 解析 

在 插入 一 行 之 后 ， 你 用 LAST_INSERT_IDO 画 数 来 获取 分 配 的 
ID, 就 像 常规 的 SELECT 语句 二 样 。 然 后 使 用 mysql_use_result QM FA 
行 的 SELECT 语句 中 获取 数据 并 将 它 打 印 出 来 ， 我 们 稍 后 将 解释 此 男 
人 
它们 。 


3. 返回 数据 的 语句 


SQL 最 常见 的 用 法 当然 是 提取 数据 而 不 是 插入 或 更 新 数据 。 数 据 
是 使 用 SELECT 语 句 提 取 的 。 


MVySQL 也 支持 使 用 SQL 语句 SHOW、DESCRIBE 和 EXPLAIN 
来 返回 结果 ， 但 我 们 不 会 在 这 里 涉及 它们 。 按 照 惯例 ， 手 册 中 包 
含 了 对 这 些 语句 的 解释 。 


在 C 应 用 程序 中 提取 数据 一 般 需 要 下 面 4 个 步 又 : 

Oo 执行 查询 ; 

D 提取 数据 ; 

O 处 理 数据 ， 

O “必要 的 清理 工作 。 

就 像 之 前 的 工 NSERT 和 DELETE 语 句 一 样 ， 你 将 使 用 mysql_query 
来 发 送 SQL 语 句 。 然 后 ， 你 使 用 mysql_store_result 或 mysql_use_result 来 
提取 数据 ， 有 具体 使 用 哪个 函数 取决 于 你 想 如 何 提取 数据 。 接 着 ， 你 将 
使 用 一 系列 mysql fetch row 调用 来 处 理 数据 。 最 后 ， 使 用 
mysql_free_result 释 放 查 询 占 用 的 内 存 资 源 。 

mysq]_use_result 和 mysql_store_result 的 区 别 主要 在 于 ， 你 是 想 一 
次 返回 一 行 数据 ， 还 是 一 次 返回 所 有 的 结果 。 当 你 预计 结果 和 集 比 较 小 
时， 后 者 会 更 加 合适 。 

“一 次 提取 所 有 数据 的 函数 

你 可 以 使 用 mysql_store_result 在 一 次 调 用 中 从 SELECT (或 其 他 返 
回 数据 的 语句 ) 中 提取 所 有 数据 : 


MYSQL RES *mysql store result(MYSQL *connection); 


显然 ， 你 需要 在 成 功 调 用 mysql_query 之 后 使 用 此 函数 。 这 个 函数 
将 立刻 你 存在 客户 并 中 返回 的 所 有 数据 。 它 返回 一 个 指向 结 采 集结 构 
的 指针 ， 如 琳 失 败 则 返回 NULL ° 

在 mysql_store_result 调 用 成 功 之 后 ， 你 需要 调用 mysql_num_rows 
来 得 到 返回 记录 的 数目 ， 我 们 硕 望 这 是 个 正 数 ， 但 是 如 果 没 有 返回 
行 ， 这 个 值 将 是 0。 
my ulonglong mysql num rows(MYSQL RES *result); 


jT EN Z 257 H1mysql. store resultix E ZG RAGS, JE 3R [ul i RR 
集中 的 行 数 。 如 果 mysql_store_ result 调 用 成 功 ，mysql_num_rows 将 始 
终 都 是 成 功 的 。 

通过 对 这 些 函 数 的 组 合 使 用 ， 你 获得 了 一 种 提取 你 所 需要 数据 的 
简单 方法 。 到 了 这 里 ， 所 有 数据 对 于 客户 端 来 说 都 是 本 地 的 ， 你 不 再 


需要 担心 可 能 的 网 络 或 数据 库 错 误 了 。 对 返回 行 数 的 获取 将 有 助 于 你 
进行 随后 的 编程 。 

如 果 你 碰巧 使 用 的 是 一 个 特别 庞大 的 数据 集 ， 那 么 最 好 提取 小 一 
些 、 更 容易 管理 的 信息 块 ， 因 为 这 将 更 快 地 将 控制 权 返 回 给 应 用 程 
序 ， 并 且 不 会 占用 大 量 的 网 络 资源 。 我 们 将 在 介绍 mysql_use_result 的 
时 候 ， 详 细 探 讨 这 一 想法 。 

现在 ， 你 可 以 使 用 mysql fetch row 来 处 理 它 ， 也 可 以 使 用 
mysql_data_seek、mysql_row_seek 和 mysql_row_tell 在 数据 集中 来 回 移 
5) PLL RA Bik BH © 

O mysql fetch row: 这 个 函数 从 使 用 mysql_store_result 得 到 的 结 
果 结 构 中 提取 一 行 ， 并 把 它 放 到 一 个 行 结 构 中 。 当 数据 用 完 或 发 生 错 
误 时 返回 NULL。 我 们 将 在 下 一 方 中 回 过 来 处 理 行 结构 中 的 数据 。 


MYSQL ROW mysql fetch row(MYSQL RES *result); 


O mysql data seek: 这 个 函数 用 来 在 结果 集中 进行 跳 转 ， 设 置 将 
会 被 下 一 个 mysql_fetch_row 操 作 返 回 的 行 。 人 参数 offset 的 值 是 一 个 
行 号 ， 它 必须 在 0 到 结 于 集 总 行 数 减 1 的 范围 和 内。 传递 0 将 会 导致 
一 个 mysql_fetch_row 调 用 返回 结果 集中 的 第 一 行 。 

void mysql data seek(MYSQL RES *result, my ulonglong offset); 


L1 mysql row tell: 3x SUR [8| — AmE, CARRAR 
集中 的 当前 位 置 。 它 不 是 行 号 ， 你 不 能 把 它 用 于 


mysql data seek ° 


MYSQL ROW OFFSET mysql row tell(MYSQL RES *result); 


O 但 是 ， 你 可 以 这 样 使 用 它 的 返回 值 : 


MYSQL ROW OFFSET mysql row seek(MYSQL RES *result, MYSQL ROW OFFSET offset); 


这 将 在 结 末 集 中 移动 当前 位 置 ， 并 返回 之 前 的 位 置 。 


这 对 函数 对 于 在 结果 集中 的 已 知 点 之 间 的 移动 非常 有 用 。 但 
请 小 心 不 要 混淆 了 由 row_tell 和 row_seek 使 用 的 偏 移 量 和 data_seek 
使 用 的 行 号 。 否 则 ， 结 果 将 变 得 不 可 预知 。 


O 完成 了 对 数据 的 所 有 操作 后 ， 你 必须 明确 地 调用 
mysql free result? iE MySQL E 5E Bi, Jey 4E o 


void mysql free result(MYSQL RES *result); 


O ETH ARRIERE, TRU is. oe 8] H IG ES CR LE 


MySQL 库 清理 它 分 配 的 对 象 。 
"提取 数据 


现在 可 以 编写 你 的 第 一 个 数据 提取 应 用 程序 了 。 你 想 要 选择 所 有 
年 龄 大 于 5 的 记录 。 因 为 还 不 知道 如 何 处 理 这 些 数 据 ， 所 以 你 将 仅仅 提 
取 它 们 。 提 取 结 采集 并 届 历 提取 数据 的 重要 代码 片断 用 阴影 显示 。 


面 是 select1.c 的 UR RAS: 


' "mysq 
MYSQL my corne 
MY: ES re. 
MY. 1 
r t ar *argvi ( 
Y on! 
my nect local t rick 
*secrset*, *foo*, 0, NULL, 0) 
inti ("Connection success' \n*)3 
t 11 & r tion, E T lno, fname 
age M childrer ERE age 
pri r 3 r lemy r 
res ptr = mysql store result(&kmy. connection); 
f [re "a Lr) { 
printf|*Retrieved tlu rowsin* 


, tunsigned long)mysqgl num rows(res ptr)]: 
while Ieqlrow = mysqi_fetch_row(|res_ptr)}) { 
printé ("Fetched data. «a Bo) 1 


RETR 
Fy T X 47 te A BN Hs — 1 RIX xe TR BEE , 


mysql_use_result 而 个 是 mysql]_store_result ° 


MYSQL RES *mysql use result(MYSQL *connection) ; 


你 将 依靠 


与 mysql_store_result 函 数 一 样 mysql use result jÈ £l] £6 TX] tE, 
返回 NULL。 如 果 成 功 ， 它 返回 指向 结果 集 对 象 的 指针 。 但 是 ， 不 同 
之 处 在 于 它 示 将 提取 的 数据 放 到 它 初始 化 的 结果 集中 。 


为 了 真正 得 到 数据 ， 你 必须 反复 调用 mysql_fetch_row 直 到 提 
取 了 所 有 的 数据 。 如 果 没 有 mysql_use_result 中 得 到 所 有 数据 ， Jb 
么 程序 中 后 续 的 提取 数据 操作 可 能 会 返回 遭 到 破坏 的 信息 。 


那么 ， 调 用 mysql_use_result 和 调用 mysql_store_result 的 歼 UH 何 
不 同 呢 ? 前 者 具备 资源 管理 方面 的 实质 性 好 处 ， 但 是 它 不 能 
mysql_data_seek、 或 mysql_row_seek 或 mysql_row_tell 一 起 使 用 ， XH 
DERE Md mysql num _rows 的 使 用 

Ax el 

你 还 增加 了 时 延 ， 因 为 每 个 行 请 求 和 结 采 的 返回 都 必须 通过 网 
络 。 另 外 还 存在 一 种 可 能 性 是 ， 网 络 连接 可 能 在 操作 中 途 失 败 ， 留 给 
你 不 完整 的 数据 。 

但 是 ， 无 论 怎样 ， 这 些 都 不 会 抹 去 我 们 之 前 提 到 的 它 带 来 的 好 
处 更 生地 平和 了 网 络 负 载 ， 以 及 减少 了 可 能 非常 大 的 数据 集 市 来 的 
子 

把 select1l.c 修 改 为 select2.c， 这 里 将 使 用 mysql_use_result 函 数 。 因 
为 很 简单 ， 所 以 我 们 仅仅 以 阴影 方式 显示 修改 的 代码 片断 : 


注意 观察 ， 在 提取 最 后 一 个 结果 之 前 ， 你 仍然 无 法 得 到 行 数 。 但 
是 ， 通 过 早期 和 经 常 性 的 错误 检查 ， 可 以 使 得 程序 调整 为 使 用 
yedl use reiult 变 得 更 加 容易 。 以 这 种 方式 编写 代码 可 以 减少 许多 程 
序 后 期 修改 市 来 的 烦恼 。 

4. 处 理 返 回 的 数据 

现在 你 已 知道 了 如 何 提取 行 ， 下 面 可 以 学 习 如 何 处 理 返 回 的 实际 


ae 
如 同 大 多 数 SQL 数 据 库 一 样 ，MySQL 返 回 两 种 类 型 的 数据 。 


数据 


D“ 从 表 中 提取 的 信息 ， 也 就 是 列 数据 。 
o 关于 数据 的 数据 ， 即 所 请 的 元 数据 (metadata) ， 例 如 列 各 和 
让 我 们 首先 关注 如 何 将 数据 本 身 转化 为 有 用 的 形式 。 
mysql field_count 函 数 提供 了 一 些 关 于 碍 询 结果 的 基本 信息 。 它 接 

受 连 接 对 象 ， 并 返回 结果 集中 的 字段 ( 列 ) 数目 : 


unsigned int mysql field count(MYSQL *connection); 


在 更 通用 的 方式 下 ， 你 可 以 用 mysql_field_count 做 其 他 事情 ， 比 如 
判断 为 何 mysqlLstore result 的 调用 会 失败 。 人 例如， wR 
mysql_store_result 返 回 NULL ， 但 是 mysqlL_field_count 返 回 一 个 正 数 ， 
你 可 以 推测 这 是 一 个 提取 错误 。 但 是 ， 如 果 mysql_field_count 返 回 0， 
则 表示 没有 列 可 以 提取 ， 这 可 以 解释 为 何 存储 结果 会 失败 。 我 们 有 理 
由 认为 ， 你 应 该 了 解 一 个 特定 查询 应 返回 的 列 数 。 因 此 ， 对 于 通用 碍 
询 处 理 模块 或 任何 随意 构造 查询 的 情况 ， 这 个 函数 是 非常 有 用 的 。 


在 为 旧版 本 的 MySQL 所 写 的 代码 中 ， 你 可 能 会 看 到 使 用 
mysql_num_fields 的 情况 。 它 可 以 接受 一 个 连接 结构 或 一 个 结果 结 
构 指 针 作为 参数 ， 并 返回 列 数 。 


如 宁 抛 开 对 数据 的 格式 化 不 管 ， 那 么 你 已 经 知道 如 何 立 刻 打 印 出 
数据 了 。 你 可 以 添加 人 简单 的 display_row 芳 数 到 select2.c 程 序 中 。 


请 注意 ， 为 了 人 简化 程序 ， 你 把 连接 、 结 果 和 mysq]_fetch_row 
a © 我 们 并 不 建议 在 产品 代码 中 这 样 


las 
y 


(1) 下 面 是 非常 简单 的 打印 数据 的 代码 : 


(2) 将 它 添加 到 select2.c 中 ， 并 添加 一 个 声明 和 一 个 函数 调用 : 


void display row(! 


(3) 现在 ， 把 完成 的 代码 保存 为 select3.c。 最 后 ， 按 如 下 方式 编 
译 并 运行 select3: 
> gcc -I/usr/include/mysql select3.c -L/usr/lib/mysql -leysqiclient -o select3 


5 ./select3 
'onnection success 


| Jenny 21 
Fetched data 


看 来 ， 程 序 可 以 运行 了 ， 虽 然 它 的 输出 不 是 特别 美观 。 但 是 你 并 

未 考虑 结 末 中 可 能 出 现 的 NULL 值 。 如 果 想 要 打印 出 更 整洁 的 格式 化 
(或 许 是 表格 化 ) 的 数据 ， 你 需要 同时 得 到 MySQL 返 回 的 数据 和 元 数 
» 7 E 以 使 用 mysql_fetch_field 来 同时 将 元 数据 和 数据 提取 到 一 个 新 


MYSQL FIELD *mysgl fetch field(MYSQL RES *result); 


你 需要 重复 调用 此 函数 ， 直 到 返回 表示 数据 结束 的 NULL 值 为 
止 。 然 后 ， 你 可 以 使 用 指向 字段 结构 数据 的 指针 来 得 到 关于 列 的 信 
上 筷 。 结 构 MySQL_FIELD 定 义 在 mysql.h 中 ， 如 表 8-12 所 示 。 


表 8-12 


MySQL. FIELDS H mmm A 说 A 


name: We, 为 call 
az “table; HHKMARA. SPURNS PRY. RSM. IER 
Of Pea Met u HEN OO M Max. NOU FO eg erg mm 
m M Utlimyssi list fíelde CRETA E38 Ar REO. CESEQLE UAI 
MIMA 
enum enum field types type 列 类 型 ， 请 查看 紧 哆 此 表 的 说 明 
nsigned int length 列 赛 ， 在 定义 用时 指定 
nsigeed int max length; 如 来 使 用 四 ctore_result. S su T" aa 
WDK. 如 时 使 用 0 | result, £T 
flags: RTE AGES: NERDEN EX. " a: RBM. E 
1) Br LFLN "n1.XEY FL 81 FLAG. AUTO INCREMENT 
FLA iis 可 ENA I9 MySQL "a 


Mt iif eres (Let POF RA 


| SAI 完整 列表 见 头 文件 mysql_com.h 和 文档 。 和 常见 的 


FIELD TYPE DECIMAL 
FIELD TYPE LONG 
FIELD TYPE STRING 
FIELD TYPE VAR STRING 


一 个 特别 有 用 的 预定 义 宏 为 IS_ NUM， 当 字段 类 型 为 数字 时 ， 它 
返回 true， 像 下 面 这 样 : 


if (IS NUM(myslq field ptr-»type)) printf("Numeric type field\n"); 


fe pity ZU BU. Ted libus Rte PRL: 


MYSQL FIELD OFFSET mysql field seek(MYSQL RES *result, 
MYSQL, FIELD, OFFSET offset]; 


PR DÀ FH EGER OE T. EARNS RS, AIMO m SS 
Be ane 而 自动 增加 。 如 采 给 参数 offset 传 递 什 0， 你 将 路 
[3] 28 — 5 

现在 你 得 到 信息 了 ， 你 需要 让 select 程 序 显示 和 某 一 指定 列 相关 的 
所 有 额外 数据 。 

下 面 是 程序 select4.c， 我 们 在 这 里 重新 完整 地 显示 了 整个 程序 的 产 
代码 ， 这 样 你 就 可 以 看 到 一 个 完整 的 例子 了 。 注 意 ， 它 并 没有 试图 对 
列 类 型 进行 详尽 的 分 析 。 


finclude <stdlib.h> 
Winclude <stdio.h> 


include 'mysql.h* 


MYSQL my connection; 
MYSQL RES "res ptr; 
MYSQL ROW sqlrow: 


void display beader|]; 
void display row|]: 


int main(int argc, char *argvi]) ( 
int res; 


int first row = 1; /* Used to ensure we display the row header exactly once 
when data is successfully retrieved */ 


mysqi initi&my connection); 
if (mysql real connect(&my connection, *localbost*, "rick", 
*secret*, *foc*, 0, NULL, 0)) ( 
printf(*Connsection success\n") ; 


res = mysgl query(&my connection, "SELECT childno, fname, 
age FROM children WHERE age > 5°); 


if (res) ( 
fprintf[stderr, “SELECT error: s\n", mysql_error lemy connection]]; 
] eise { 
res ptr = mysql use result (&my. connection]; 
if (res.ptr) ( 
while {(sqlrow = mysql fetch row(res ptr)]] ( 
if (first row) | 
display header|]; 
fírst row «= 0; 
) 
display. row(); 
J 
if [mysql errno|&my connection)) | 
fprintf(stderr, "Retrive error: n\n’, 
mysql errori(&my connecticon)]; 


】 
mysql free resultires ptr]: 
j 


} 
mysql_close (&my_connection); 
) else ( 
fprintf(stderr, ‘Connection failed\n"); 
if (mysql errno(&my connection]) ( 
fprintf(stderr, “Connection error td: ts\n", 

mysqi errno[&my connection], 
mysql_error [&my, connection) ) ; 


return EXIT SUCCESS; 


void display header() | 
MYSQL FIELD *field ptr; 


printf (*Coluen details:\n"}; 

while ([fieid ptr = myaqi_fetch_fieldirea_prr))} l= NULL) ( 
printf(*it Name: ts\n*, field ptr-»name); 
printf(*it Type: Fi 
if (1$ NUM(field ptr-»typel) ( 


printf|'Numeric field\n*); 


switch[field ptr-»type) ( 
cage FIELD TYPE VAR STRING: 
printf (*VARCHAR\n*); 
break: 
case FIELD TYPE LONG 
printf('LONO ^n"): 
break; 
default 
print tf "Type is td, check in mysql com.hin*, field ptr-»typel: 
* switch */ 


} /* else * 


printft(*\t Max width tildin, field ptr->length); 
f£ (field ptr-»flags & AUTO INCREMENT FLAG) 
printf['it Auto increments'in" 


J 


void display row|) ( 
unsigned int fleld count; 


field count = 0; 

while (field count < mysql field count (amy_connection!) ( 
if (sqirow[fiíeld count]) printfi*ts *, sqirow[field count]); 
else printf ("NULL"); 
field count+ 

) 

printf(*'*n*); 


编译 并 运行 此 程序 时 ， 你 得 到 的 输出 为 : 


5 ./select4 


Nam nam 

Ts AR 

ryt ? 

MAX 上 

Nam ze 

T«r em 

itype sume e 
Max ith 

umn dera 
i 


这 仍然 不 是 很 漂亮 ， 但 它 很 好 地 阐明 了 如 何 通 过 同时 处 理 原始 数 
据 和 元 数据 来 更 有 效 地 使 用 数据 。 

你 还 可 以 通过 其 他 一 些 画 ; a A RIETI BERE o 
但 通常 你 需要 使 用 的 所 有 例 程 都 在 这 里 介绍 了 人 ， 感 兴趣 的 读者 也 可 以 
在 MySQL 手 册 中 找到 更 多 信息 。 


8.3.4 . 


表 8-13 中 显示 了 其 他 一 些 我 们 建议 你 了 解 的 API 函 数 。 一 般 情 况 
下 ， 到 目前 为 止 介绍 的 所 有 函数 对 于 实现 一 个 可 工作 的 程序 已 足够 
了 ， 但 是 ， 你 将 会 发 现下 面 这 个 挑选 过 的 列表 也 很 有 用 。 


表 8-13 
示例 API 调 用 | mu LN 
lient.. inf f Eo e P p p LI ME PERRA (1 E 
AS BE 


Neg. * t 1 yd * E EOD IR e 4 AA 
TREASON OONN irae eel tide fe. RIER He a 
mi QF ih smrR arrita, FER 


mx mn ST Cr. ERA US DOS S NS 
Homo. MU ERO 


down (MySQL *cenrect ior = RATER. BREAKS 
ph ener i 8&8. Hn X m vie me SN Asiarooms DEFAULT. 成 


DM IERI 


8.4 CD VH 


现在 ， 你 将 看 到 如 何 创 建 一 个 位 单 的 数据 库 来 保存 CD 唱片 的 信 
思 ， 人 然后 编写 一 些 代码 来 访问 这 些 数据 。 为 尽量 保持 代码 的 简单 ， 使 
其 易于 理解 ， 你 将 仅仅 侵 用 3 个 数据 库 表 ， 而 且 它 们 之 间 的 天 系 也 非常 


简单 。 
首先 ， 创 建 一 个 新 的 数据 库 ， 然 后 将 其 作为 当前 的 数据 库 


mysgl» create database bipcd; 


现在 ， 你 已 准备 好 设计 和 创建 你 需要 的 表 了 。 

这 个 例子 会 比 以 前 的 稍微 复杂 一 点 ， 因 为 你 将 把 CD 唱片 分 成 3 个 
不 同 的 元 素 : 艺术 家 (BA) 、 主 标题 和 曲目 。 如 果 考 虑 到 一 套 CD 
收藏 以 及 它 的 组 成 元 素 ， 你 会 意识 到 每 张 CD 都 由 不 同 的 曲目 组 成 ， 但 
不 同 CD 之 间 又 在 许多 方面 相互 关联 : 通过 乙 术 家 或 组 合 、 通 过 制作 公 
司 、 通 过 音乐 表现 风格 等 。 

如 条 试图 以 一 种 灵活 的 方式 来 保存 所 有 这 些 不 同 的 元 素 ， 你 的 数 
据 库 将 变 得 相当 复杂 ， 但 在 本 例 中 ， 你 将 仅 限 于 使 用 两 种 最 重要 的 天 


首先 ， 每 张 CD 由 不 同 数目 的 曲目 组 成 ， 所 以 你 将 把 曲目 数据 储存 
在 一 个 独立 于 其 他 CD 数据 的 表 中 。 其 次 ， 每 位 艺术 家 (或 乐队 ) 经 常 
会 有 多 张 专辑 ， 所 以 只 将 艺术 家 的 信息 存储 一 次 ， 然 后 单独 提取 属于 
该 艺术 家 的 所 有 CD 是 非常 有 用 的 。 我 们 不 会 党 试 将 乐队 拆 分 成 不 同 的 
艺术 家 (乐队 的 每 个 成 员 可 能 都 有 属于 自己 的 专辑 ) 或 处 理 合 集 CD 
一 一 这 是 为 了 尽量 保持 例子 的 简单 ! 

同样 ， 你 也 需要 保持 关系 的 简单 一 一 每 个 艺术 家 (也 可 能 是 乐队 
名 称 ) 可 能 制作 一 张 或 多 张 CD， 每 张 CD 包 含 一 个 或 多 个 曲目 。 这 种 
关系 如 图 8-8 所 示 。 


8.4.1 创建 表 


现在 ， 你 需要 确定 表 的 实际 结构 。 我 们 从 主 表 一 一 CD 表 开 始 ， 它 
保存 大 部 分 的 信息 。 你 需要 保存 一 个 CD ID、 一 个 分 类 号 、 一 个 标题 
以 及 一 些 你 目 己 的 标注 。 你 还 需要 一 个 来 目 artist 表 的 ID 号 来 表明 是 哪 
位 艺术 家 制作 了 这 张 专辑 。 

artist 表 很 简单 ， 它 仅仅 保存 乞 术 家 的 名 字 和 一 个 唯一 的 艺术 家 ID 
号 。track 表 也 很 简单 ， 你 只 需要 一 个 CD ID 来 表明 曲目 属于 哪 张 CD、 
一 个 曲目 号 和 一 个 曲目 标题 o 

首先 是 CD 表 : 


CREATE TABLE cd 
4 INTEG 


E AUTO INCREMENT NOT NULL PRIMARY KEY 


NULL 
catalogue VARCHAR (3 NOT NULL 


这 创建 了 表 cd， 它 包含 下 面 一 些 列 。 
O id 列 ， 包 含 一 个 目 动 增加 的 整数 ， 它 是 表 的 主键 。 


最 长 为 70 个 字符 的 title。 

artist_id， 在 artist 表 中 使 用 的 一 个 整数 。 

最 长 为 30 个 字符 的 catalogue 号 。 

最 长 为 100 个 字符 的 notes 。 

只 有 notes 列 可 以 为 NULL， 所 有 其 他 的 列 都 必须 含有 值 。 


面 是 artist 表 : 


E 
[] 
[] 
L 


nE 


你 又 有 了 一 个 id 列 和 一 个 艺术 家 name 列 。 
最 后 是 track 表 : 


CREATE TABLE track 
1 id INTEGER NOT NULL 
track id INTEGER NOT NULI 
itie VARCHAR D 
PRIMARY KEY[Cd id, track id 


注意 ， 这 次 你 用 不 同 的 方法 来 声明 主键 。track 表 的 不 寻常 之 处 在 
于 每 张 CD 的 ID 会 出 现 多 次 ， 而 对 于 任何 指定 曲目 的 ID ， 例 如 曲目 1 
也 会 在 不 同 的 CD 中 出 现 多 次 。 但 是 ， 这 两 者 的 结合 将 永远 是 唯一 的 ， 
所 以 我 们 将 主键 声明 为 这 两 列 的 结合 。 这 被 称 为 是 联合 键 ， 因 为 它 由 
多 列 联合 组 成 。 

将 这 些 SQL 语 名 存储 在 文件 create_table.sql 中 ， 并 将 该 文件 保存 在 
当前 目录 中 ， 然 后 开始 创建 数据 库 及 其 中 的 表 。 当 这 些 表 已 存在 时 ， 
我 们 提供 的 脚本 样 例 还 包含 额外 的 命令 用 于 丢弃 这 些 表 ， 但 默认 情况 
下 ， 这 些 命令 是 被 注释 掉 的 。 


$ mysql -u rick -p 
Enter pa: Word: 


‘commands end with ; or \g 
use biped; 


T ri» V. create tables.sqi 


注意 我 们 使 用 \. 命 令 将 create_tables.sql 文 件 作 为 输入 。 
你 也 可 以 使 用 MySQL 查 询 浏览 器 (MySQL Query Browser) ， 通 
过 执行 SQL 或 徐 单 地 输入 数据 来 创建 表 o 


— HG € tf ze, UK wt n] LA i zb MySQL E H a 
Administrator) 来 查看 它 ， 如 图 8-9 所 示 。 在 图 中 ， 你 正在 检 
a odes -l 你 的 首选 术语 ) 。 


My SOL Aceninierraror rick otocalho via tocke 


( MySQL 
查 blpcd 数 


你 可 以 通过 选择 编辑 表 (在 Tables 标 签 中 右键 单 击 或 双击 表 名 ) 


看 到 列 HU VEA HU 


fe fdi yew Bob MySOL tere Help 
WB Server nenaton no 
QD Serve Control | : T 
J Startup Parameters [DO rdc scheme Vot 
BA er areurnren | [pe imercotumn Name dex Type Unie — Mul ABowed Sed n nder Cotation 
M Server Commoctions D artist PRIMARY RIREF = UNIQUE 
te Health ou 1 averting 
Sig server toy * ed PRIMARY BTREE — UNIQUE 
inp ve 1 fo eriding 
Restore Backup v track PRIMARY STREE UNIQUE 
dif Pepacation status 9 cd d i Ascending 
9 rock id 2 ascending 
Schemata 
1 foo | 
ms m 
rick iz 
— à aa -一 一 
图 8-9 


。 如 图 8-10 所 示 。 


Table Editor 


Table Name: [track | Comment: 'innoDB free: 4096 kB 


M ————.— 


Coumans and indices Table Options Advanced Options. 


Column Name Data Type Wi E" flags Default Value Comments 


3 cd d 
T Lrack id 
È title 


INTEGER eL 
INTEGER a 
VARCHAR 70) C 


x Discard Changes 


¥ Apph Changes 


&| 8-10 


你 注意 到 图 8-10 中 针对 cd_id 列 和 track id 列 的 两 个 关键 符号 了 吗 ? 
它 表 示 这 两 个 列 都 属于 联合 主键 。 曲 目标 题 可 以 为 NULL (注意 NOT 
NULL 并 没有 被 选中 ) 表示 我 们 允许 CD 曲目 没有 标题 ， 这 种 情况 虽然 
少见 ， 但 并 非 不 会 出 现 。 


8.4.2 ”添加 数据 


现在 ， 你 需要 添加 一 些 数据 。 最 好 的 检查 数据 库 设 计 的 方法 是 ， 
添加 一 些 样 本 数据 并 检查 它们 是 否 都 能 正常 工作 。 

我 们 在 这 里 将 仅仅 展示 一 个 测试 输入 数据 的 例子 ， 因 为 所 有 的 输 
入 都 基本 相似 一 它们 仅仅 是 加 载 不 同 的 表 ， 所 以 它 并 不 是 理解 发 生 
何事 的 关键 。 下 面 有 两 个 要 点 需要 注意 。 

口 “ 这 个 脚本 将 删除 任何 已 有 的 数据 以 确保 脚本 是 干净 的 。 

O “在 ID 字段 中 插入 数值 ， 而 不 是 让 AUTO_INCREMENT 来 目 动 

分 配 。 在 这 里 这 样 做 会 更 安全 ， 因 为 不 同 的 插入 操作 需要 知道 哪 

些 值 已 被 使 用 以 确保 数据 关系 是 完全 正确 的 ， 因 此 最 好 强制 指定 

数值 ， 而 不 是 允许 AUTO_INCREMENT 郴 数 来 自动 分 配 数值 。 

这 个 文件 叫 {iilinsert_data.sql, 它 可 以 使 用 你 前 面 见 到 的 \. 命 令 来 执 


~~ Then the c t 

insert int ed id J e 

l, B00002åD4P 

ing into cd 1 que a 

BO 4D4 

n 1 valu k 

BO (EX 

in r itl cat 1d E t 
Pou 2M 

ins I t 


E 然后 是 下 一 张 专辑 
等 等 
直到 最 后 的 曲目 : 


> tracKkice_id, track id, titie ralues(& 


接着 将 它 保 存 为 pop_tables.sql， 并 像 前 面 那样 在 mysql 提 示人 符 下 用 
\ 命 令 执 行 它 。 


注意 在 cd 5 (IGiomi) 曲目 3 中 ， 曲 目 m un'altra vita t £ fit 
号 。 为 了 将 其 插入 到 数据 库 中 ， 你 必须 用 反 斜 杜 C) 2651 FA it 


E o 


现在 是 时 候 检查 你 的 数据 是 否 合理 了 o MEAE mysql te E 
mea * 首先 ， 从 数据 库 中 选 出 每 张 专辑 的 


k” FROM artist cd, track WHERE artist.id 
z 1 


REM MySQL 查询 浏览 器 中 尝试 这 文 个 SQL 语句 ， 你 可 以 看 到 提取 
出 的 数据 很 好 ， 如 图 8-11 所 示 。 


这 个 SQL 语句 看 起 来 很 复杂 ， 但 是 如 采 你 将 该 语句 分 解 开 来 看 ， 
EBA ERB A MEERA T° 
先 负 上 略 SELECT 命 令 中 的 AS 部 分 ， 第 一 部 分 仅仅 是 : 


SELECT artist.name, cd.title, track.track_id, track.title 


它 只 是 通过 使 用 标记 tablename.column 来 说 明 你 想 要 显示 哪些 列 。 


SELECT artist pare, title AS “CD Title", b «xh id ~ 
F itr title AS . = MN 
"Trach" FROM artist, cd, track WHERE ATi id = a !o id CT teeode < 


一 一 一 一 一 一 -一 -一 一 一 -- —— AD D p— 
| nane CD Tite track id Tack <| Schomata > 


Wink Floyd (ark Side of the Moon 1 Speak ro me ^ al 
| Pink payd Darke Side of the Mam — 2 Mathe HOPES 
|  Phkhoyd Wish you Were Here 1 Shine on you crazy diamond > di artt 
| Pink Floyd Wish You Were Here 2 Welcome tu the machine » 可 cd 

Genesis A Bich of tbe Tal 1 Dante on a volcano b Zi track 
| Genesis A Tick of the Ted 2 Entanged lias 
| Genesi Selling England By the Pound 1 Dancing with the mooniit knight nid 
| Genesis Selling England Dy the Pound 2 | know what | ke a - 
| Cnwd !Gom 1 Melodia Africana (part 1) re 
| £insudi — !Glori 2 | due fiumi oir 
| Melanie C Northem Star 1 Go! "Syntax | hunetions | aram. 

Melanie C Northem Star 2 Northern Star HF: 

v © Dete DefiniUun St— 
A ALTER DATABA: 


A ALTER TABLE S| | 
A^ CREATE DATAS) | 
---— —— > | 


12 rows fetched is 0.00.0599 Wrst (uat PSexch OL - [T DP | 
rows ~ Query finished. 


SELECT 语句 的 AS 部 分 SELECT artist .name, cd. title AS “CD 
Title", track.track_id i track.title AS“Track” 只 是 在 输出 中 重 命 名 列 
名 。 因 此 ， 来 自 cd 表 的 tile 列 (cdtitle) 的 标题 栏 被 命名 为 “CD 
Title”，track.title 列 被 命名 为 “Track”。AS 的 使 用 给 了 我 们 更 友好 的 输 
出 ， 它 是 在 命令 行 中 针对 SQL 语句 的 一 个 有 用 的 字句 ， 但 当 你 通过 其 
他 编程 语言 来 调用 SQL 语句 时 ， 你 几乎 不 会 用 到 它 。 

接 下 来 的 部 分 也 非常 地 人 简单 易 懂 ， 它 告诉 服务 旭 你 使 用 的 表 名 : 


FROM artist, cd, track 
WHERE 子 句 是 需要 点 技巧 的 部 分 : 


WHERE artist.id = cd.artist_id AND track.cd id = cd.id AND track.track id < 3 


第 一 部 分 告诉 服务 器 artist 表 中 的 ID 应 与 cd 表 中 的 artist_id 相 同 ° 
住 ， 你 仅仅 保存 了 一 次 艺术 家 的 名 字 并 在 CD 表 中 使 用 ID 来 引用 它 。 x 
一 部 分 ，track.cd_id = cd.id， 为 表 track 和 cd 做 同样 的 事情 ， 即 告 诉 服务 
88 track 3€ HJ cd id 7| Av 5j cd z& P B id 7! 4H [B] 9. 58 — Sp 4 
track.track_id<3， 减 少 了 返回 数据 的 数量 以 使 得 你 仅仅 从 每 张 CD 中 得 
到 曲目 1 和 曲目 2。 最 后 ， 你 使 用 AND 把 3 个 条 件 结合 起 来 ， 因 为 你 想 
让 这 3 个 条 件 同 时 都 为 真 。 


8.4.3 CHE IA 


我 们 并 不 准备 在 本 章 中 编写 一 个 市 有 GUI 的 完整 的 应 用 程序 ， 而 
是 专心 于 编写 一 个 接口 文件 ， 从 而 允许 你 以 一 种 合理 而 又 简单 的 方式 
通过 C 语 言 来 访问 数据 。 编 写 这 类 代码 的 一 个 常见 问题 是 无 法 知道 返 
回 的 结果 数 ， 以 及 如 何在 客户 端 代码 和 访问 数据 库 的 代码 间 传 递 这 些 
结 采 。 在 这 个 应 用 程序 中 ， 为 了 保持 简单 并 专注 于 数据 库 接口 (这 是 
代码 中 的 重要 部 分 ， 我 们 将 使 用 固定 大 小 的 结构 。 但 在 实际 的 程序 
中 ， 这 可 能 是 不 能 接受 的 。 一 种 常见 的 解决 方法 ( 它 同 时 也 有 助 于 减 
少 网 络 流量 ) 是 每 次 总 是 提取 一 行 数据 ， 正 如 你 在 本 章 前 面 看 到 的 函 
"iimysql. use resultfilmysql. fetch row—fE ? 

1. 接 口 定 义 

344i 25 M 3E X ffFapp. mysql.h7F8, EEN T ZETA ERA: 

MES 


sd id[MAX CD RESULT]: 


然后 是 一 对 函数 ， 它 们 用 于 连接 数据 库 以 及 从 数据 库 断 开 连 接 : 


现在 ， 我 们 转向 操纵 数据 内画 数 。 注 意 ， 没 有 创建 或 删除 乙 术 家 


的 函数 。 你 将 在 后 台 实 现 它 ， 根 据 需 要 创建 艺术 家 条 目 ， 然 后 当 它们 
不 再 被 任何 专辑 使 用 iiit SE GER 。 


'unctions adding a CD 
add cdichar *artíst har tle ha catalogue, int *cd id! 
dd tracks[struct current tracks st *tracks 
Functions for finding ar eving a CD * 
nd cds B jearct t tr sarch. 1 
g edfint cd_id, s ent cd. *dest 
get cà. ACHI ut Lid t urr crack a 
Function r deleting e 
delere = 41 id 


搜索 画 数 相当 通用 你 传递 一 个 字符 串 ， 然 后 它 将 在 artist ^ title 
或 catalogue 条 目 中 搜索 该 字符 串 。 

2. 测 试 应 用 程序 接口 

在 实现 接口 之 前 ， 你 将 编写 一 些 代 码 来 使 用 它 。 这 看 起 来 可 能 
点 奇怪 ， 但 在 开始 实现 接口 之 前 了 解 一 下 它 将 如 何 运转 通常 是 个 好 方 


下 面 是 app_test.c 的 源 代码 。 首 先是 一 些 includes 和 structs: 


#include <stdlib.h> 


int asin 


A 用 程序 要 做 的 第 一 件 事 始终 是 ， 初 始 化 一 个 数据 库 连 接 并 提供 
一 个 正确 的 用 户 名 和 密码 (一 定 要 用 自己 的 用 户 名 和 密码 ) : 


database start("rick", "secret"); 


然后 ， 测 试 添加 一 张 CD: 


res = add cd("Mahler", “Symphony No 1", "4596102", &cd id); 
printf("Result of adding a cd was $d, cd id is td\n", res, cd id); 
memset(&ct, 0, sizeof(íct)); 
ct,cd.id = cd. id; 
strcpy(ct.track[0], "Langsam Schleppend"); 
strcpy(ct.track[1], "Kraftig bewegt"); 
trcpy(ct.track[2], "Feierlich und gemessen"); 
Ste ees vers teenie ], "Sturmisch bewegt"); 
add _ tracks (&ct) 


现在 搜索 CD， 并 从 找到 的 第 一 张 CD 中 提取 信息 : 


res = find cds('Symphony*, &cd res]; 
printf("Found $d cds, first has ID $&din*, res, cd res.cd id[0]); 


res = get cd(cd res.cd id[0], &cd); 
printf("get cd returned $dWMn", res]; 


memsetí(&ct, 0, sizeof(ct)); 
res = get cd tracks(cd res.cd id[0], &ct); 
printf("get cd tracks returned $dWMn*, res); 
printf("Title: ts\n", cd.title); 
i x0; 
while (i « res) ( 

printf("\ttrack %d is s\n", i, ct.track{i]); 


ipes 
‘ 


最 后 ， 删 除 CD: 
res = delete cd(cd res.cd id[0]); 
printf("Delete cd returned %d\n", res); 


然后 断 开 连接 并 退出 : 


database end(); 


return EXIT SUCCESS; 


3. 实 现 接口 

现在 是 最 困难 的 部 分 : 实现 你 指定 的 接口 。 这 些 都 包含 在 文件 
app_mysql.c 中 。 

首先 是 一 些 基 本 的 includes、 你 需要 的 全 局 连接 结构 和 一 个 标志 
dbconnected， 你 将 使 用 它 来 确保 程序 不 会 在 没有 建立 连接 的 情况 下 壬 
试 访问 数据 。 你 还 使 用 一 个 内 部 函数 get_artist_id 来 改善 代码 的 结构 。 


#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 


#include "mysql.h" 
#include “app_mysql.h" 


static MYSQL my connection; 
static int dbconnected - 0; 


static int get artist id(char *artist); 


连接 到 一 个 数据 库 是 非常 简单 的 ， 就 像 你 在 本 章 前 面 看 到 的 那 
TE » TARE Rea SED SIR. T : 


int database startí(char *name, char *pwd) ( 


if (dbconnected) return 1; 


mysql initi&my connection); 
if [!mysqil real connect(ámy connection, *localhost*, name, pwd, *'blpcd*, 0, 
NULL, 0)) ( 
fprintf(stderr, "Database connection failure: td, s\n", 
mysql.errno(&my.connection), mysql error(&my, connection]]; 
return 0; 
! 
dbconnected - 1; 
return 1; 


| /* database start * 


void database end([) ( 
if {dbconnected) mysql close(&my connection); 
dbconnected = 0; 

} /* database end */ 


现在 通过 函数 add_cd 开 始 真正 的 工作 。 首 先 需要 给 出 一 些 声 明和 
进行 健全 性 检查 以 确保 你 已 连接 到 了 数据 库 。 你 将 在 所 有 编写 的 可 外 
部 访问 的 函数 中 看 到 这 一 

记 住 ， 我 们 说 过 代码 将 自动 关注 艺术 家 的 名 字 


int add_cdichar *artist, char *title, char *catalogue, int *cd_id) { 


MYSQL RES *res ptr; 
MYSQL, ROW mysqlrow; 


int res; 

char is[250]; 
char &ss[250]: 
int artist_id = 
int new cd, id = -1; 


+; 


if (!dbcomnected) return 0; 
下 一 步 是 检查 艺术 家 是 否 已 经 存在 ， 如 果 不 存 在 ， 你 就 创建 一 
个 。 这 些 都 由 函数 get_artist_id 来 实现 ， 你 将 在 稍 后 看 到 该 函数 。 


artist_id = get_artist_id(artist); 


在 有 了 一 个 artist_id 之 后 ， 你 可 以 插入 主 CD 记 录 了 。 注 意 ， 我 们 
使 用 mysql_escape_string 来 保护 CD 标题 中 的 任何 特殊 字符 。 


mysql_escape_string(es, title, strlen(title)); 
sprintf(is, “INSERT INTO cd(title, artist_id, cataloque) 
VALUES ('%s', d, '$s')", es, artist id, catalogue); 
res = mysql query([&my connection, is); 
if (res) ( 
fprintf(stderr, "Insert error $d: $sAn', 
mysql errno(&my connection), mysql error(&my connection]); 
return 0; 


} 


当 你 为 此 CD 添加 曲目 时 ， 你 需要 知道 插入 CD 记录 时 使 用 的 ID。 
你 把 此 列 设置 为 自动 增加 列 ， 因 此 数据 库 会 自动 分 配 ID ， 但 是 你 需要 
明确 地 提取 数值 。 这 可 以 通过 使 用 你 在 本 章 前 面 见 到 的 特殊 函数 
LAST INSERT ID 来 完成 。 


res = mysgl query(&kmy connection, "SELECT LAST_INSERT_ID(}"); 
if (res) ( 
printf('SELECT error: ¢s\n", mysql error(&my connection])]; 


return 0; 
) eise ( 

res ptr = mysgl use result(&my. connection); 

if (res ptr) ( 
if ((mysqlrow = mysql fetch row(res ptr))) I 
sscanf(mysqlrow[0], "$d", &new cd id); 
) 
mysql free result lres ptr); 

) 


你 不 必 担心 其 他 客户 端 同时 插入 CD 时 会 导致 D 混 乱 ，MySQL 会 
基于 每 个 客户 的 连接 来 跟踪 分 配 的 ID， 所 以 即使 你 在 提取 ID 之 前 有 另 
一 个 程序 插入 了 一 张 CD， 你 仍然 可 以 得 到 对 应 于 你 的 行 的 ID, 而 不 是 
由 其 他 程序 插入 的 行 所 对 应 的 ID 。 


最 后 ， 设 置 新 加 入 行 的 ID 并 返回 成 功 或 失败 : 
*cd_id = new_cd_id; 
if (new cd id != -1) return 1; 
return 0; 


) 
} /* add cd */ 


现在 ， 让 我 们 看 一 下 get_artist_id 的 实现 ， 其 过 程 跟 插 入 CD 记录 非 
Me Y 
第 相似 : 

/* Find or create an artist, id for the given string */ 
static int get artist id(char *artist) { 

MYSQL RES *res ptr; 

MYSQL ROW mysalrow; 


int res; 
char qs[250]; 
char is[250]; 


char es[250]; 
int artist id = -1; 


/* Does it already exist? */ 
mysql escape string(es, artist, strleniartist)!; 
sprintf(qs, "SELECT id FROM artist WHERE name = '&s'*, es); 


res = mysql query|&my connection, qs): 
if {res} ( 
fprintf lstderr, “SELECT error: Wsin", mysql error(&my connection) ); 
} else ( 
res ptr = mysql store result|&my connection]; 
if ires ptr) | 
if (mysql num rows(res ptr) > 0) ( 
if (mysqlirow = mysql fetch row(res ptr)) 4 
sscanfimysqirow[0], "dv &artist id!; 
) 
) 
mysql free resuiti|res ptt): 
) 
) 
if (artist id t= -1) return artist, id; 


sprintf(is, "INSERT INTO artistí(name] VALUES({‘ts*)", es]; 
res = mysql_query lény connection, is); 
if (res) ( 
fprintf(stderr, ‘Insert error td: Woin*, 
mysqi errno(&my connection], mysql error|&my connection]]; 
return 0; 
) 
res = mysql query i&my connection, "SELECT LAST INSERT| ID()*]: 
if (res) | 
printf(*SELECT error: ts\n", mysql error(&my,connection)]; 
return 0: 
) else { 
res ptr = mysql use result(&my connection]; 
if [res ptr) ( 
if (imysqglrow = mysql fetch row|res ptr]])) | 
sscanf(mysglrow[0], “Sd, &artist id): 
) 
mysql free result[res ptr]: 
) 
} 
return artist id; 
) /* get artist id */ 


xc DID 曲目 信息 。 你 仍然 需要 保护 曲目 标题 中 的 特 
s s 


int add tracks(struct current tracks st *tracks) { 


int res; 
char is[250]; 
char es[250]; 
int i; 


if (!dbconnected) return 0; 


wniie (tracks-»track[il[O0]) { 
mysql escape stringles, tracks-»track[i], strlen(tracks-»track[i]]); 


Sprintfí(is, "INSERT INTO track(cd_id, track id, title) 
VALUES($G, $d, '$s']", tracks-»cd id, i+ 1, es]; 
res = mysql query(&my connection, is): 
f (res) | 
fprintf(stderr, “Insert error $d: ts\n", 
mysql errno(&my connection], mysql_error(&my_connection) }; 
return 0; 
return 1; 


现在 根据 给 定 的 CD 的 ID 信 来 提取 CD 信息 。 你 将 使 用 一 个 数据 
库 联 合 在 提取 CD 信息 的 同时 提取 忆 术 家 的 ID。 这 是 很 好 的 练习 : 数据 
库 擅长 于 了 解 如 何 高 效 地 执行 复杂 查询 ， 所 以 如 宋 一 个 任务 可 以 仅仅 
通过 SQL 语 句 束 能 让 数据 库 来 完成 ， 束 决 不 要 目 己 来 编写 程序 代码 。 
这 样 不 仅 可 以 节省 目 己 的 精力 ， 不 必 编 写 额外 的 代码 ， 而 且 通 过 计数 
A i 也 可 以 提高 程序 的 执行 效率 。 


int get cd(int cd id, stru t cu st *dest) | 
MYSQL RES e 
MYSQL Wom ILrow 
ar qs[250]; 
dbconnec T urn 
memset (d ; sizeofí(*'dest 
j 1 st. 
sprir ELECT artist l.id, artist.name, cd le l.cata 
FROM &rtist, cd WHERE artist.id = cd.artist id and cd.id = &d*, cd id) 
s = mysqi 一 &my conne r q 
res 
fprintf err ELECT è r: ta\r mysql ror (4my_conne n 
res ptr mysql. re ilt(&my. nne n 
res pt 
mygzq. num rows|res ptr] 
I 加 mysqi fetch row(res p | d 
if [mysqlirow[ td*, kde artist id 
inf imysqirow/ td*, ade cd id 
rcpyides ar t nam mysqirow 


strcpy(dest-»title, mysqirow[3]); 


} 
if (dest->artist_id !- -1) return 1; 
return 0; 

) /* get. cd */ 


接 下 来 ， 你 要 实现 曲目 信息 的 提取 “。 注 意 ， 你 通过 SQL 语句 中 指 
定 一 个 ORDER BY 子 句 来 确保 曲目 以 一 个 有 意义 的 顺序 返回 。 而 且 ， 
由 数据 库 来 完成 这 些 工 作 将 比 我 们 以 任意 顺序 提取 数据 ， 并 自己 编写 
代码 来 排序 更 有 效率 o 


int get.cd tracks(int cd id, struct current tracks st *desr) [| 
MYSQL.RES *res ptr; 
MYSQL ROW mysqlrow; 


int res; 


char q5[250]; 


int i = 0, num tracks = 0; 
if (!dbconnecte return 0 
memset (dest, zeof(*dest 
dest-»cd id 


sprintf(qs. "SELECT track id, title FROM track WHERE track.cd id = èd \ 
ORDER BY ack id d id) 
res - = mysqi query |&my nn 1, as 
if 2s 
fprintf(stderr SELECT error: %s mysql e r(&my inect 
8 o 


res ptr = mysql store result(&my connection|; 


if ((num tracks = mysql num, rowsí(res ptr]! 
while (mysqlrow = mysql fetch row(res ptr]) 1 
strcpy(dest-»track[i], mysqlrow[1]); 
i++; 
} 
dest->cd_id = cd_id; 
} 
mysql_free_result(res_ptr}; 
} 
} 
return num tracks; 
) /* get. cd tracks * 


至 此 ， 你 已 添加 并 提取 了 CD 的 相关 信息 ， 现 在 是 时 候 搜索 CD 
了 。 你 通过 限制 返回 结果 的 数目 来 保持 接口 的 简单 ， 但 是 你 仍然 想 让 
图 数 告诉 你 共有 多 少 行 ， 即 使 这 多 于 你 能 够 提取 的 结果 数 。 


int find_cds(char *search str, struct cd search st *dest) 
MYSQL RES *res ptr; 
MYSQL. ROW mysqlrow; 


int res; 

char qs[500]; 
int i = 0; 
char ss[250]; 


onnected) return O 


现在 ， 清 空 结 采 结构 并 保护 查询 字符 串 中 的 特殊 子 符 : 


P 
p 


memse t zeot 


mys cape. 5 I strlení(search, str]); 


接着 ， 你 构造 一 个 查询 字符 串 。 注 意 它 需 要 使 用 相当 多 的 % 字 
从 ， 因 为 % 既 是 SQL 语 句 中 用 来 匹配 任何 字符 串 的 字符 ， 也 是 sprintf 中 
的 一 个 特殊 字符 。 


ntf ELECT DISTINCT artist.id, cd.id FROM artist, cd WHERE artist.id = 
cd.artist id and (artist.name LIKE ‘888s’ OR cd.citle LIKE ‘88tstt’ C 
cd,catalogue LIKE ‘S8%att')]", ss, ss, 88]; 
` MA 一 AS 3 
现在 ， 你 可 以 执行 查询 了 : 
res = mysql_query (&my_connection, qs); 
p r * m or TIT n i 
$ q r lt (amy n 
pt I 
ws = t ptr 
ro 
pair r (res 四 MA. ESUL 
au mysqi t s cd i 
m li. - d 
eturn mnum rows 


最 后 ， 你 将 实现 删除 CD 的 方法 。 为 了 符合 我 们 默默 地 管理 忆 术 家 
条 目的 策略 ， 当 删除 一 张 CD 时 ， 如 采 没 有 其 他 CD 包 侣 同一 个 乞 术 家 
字符 串 ， 你 将 删除 这 张 CD 对 应 的 忆 术 家 。 奇 怪 的 是 ，SQL 没 有 一 次 从 
多 个 表 中 删除 数据 的 方法 ， 所 以 你 必须 依次 从 每 个 表 中 删除 数据 。 


int delete_cd{int cá id) ( 


int res; 

char qs1250]; 

int artist íd, num rows; 
MYSQL RES *res.ptr; 
MYSQL ROW myszqirow; 


if [!dbconnected) return 0; 


artist id » -1; 
sprintfí(qs, 'SELECT artist id FROM cd WHERE artist id = 
(SELECT artist id FROM cd WHERE id = '$d')*, cd id): 
res = mysql queryl&my connection, qs); 
if [res] { 
fprintf(stderr, “SELECT error: te\n*. mysql error|[&my, connection]]; 


) eise | 
res ptr = mysql store reault [fmy connection] 
if [res ptr) ( 
num rows = mysqi num rows(res ptr]; 
if inum rows == 1) | 
/* Artist not used by any other CDs */ 
mysqirow = mysql fetch rowires ptr!; 
sscanfiímysqlrow[9], "Ia", &artist id!! 
/ 
mysqi free resultires ptr): 
} 
) 
sprintf[iqs, “DELETE FROM track WHERE cd id = ‘td'*, cd idi: 
res * mysql query|&my connecticn, qs); 
if (res) ( 
fprintfistderr, *Delete error [track] td: te\n". 
mysql errnolkmy connection), mysql error|&my connection]]: 
return 0; 


] 


sprintfi(qs, "DELETE FROM cd WHERE id = 'td'*, ed idi; 
res = mysql query ([&my,connection, gs); 
if (res) { 
fprintf(stderr, "Delete error 【cj ùd: tain", 
mysqi errno(&my connection], mysqi_error (tey connection) |; 
return 0: 
} 


if (artist id i= -1) 1 
/* artist entry is now unrelated to any CDs, delete ic */ 
sprintf(qs, "DELETE FROM artist WHERE id = "*d'*, artist id]; 
res = mysql query [kry connection, qs]: 
if (res) | 
fprintf(stderr, “Delete error (artist} td: te\n", 
mysql errno(&my connection), mysql_error(amy_connection) }; 
} 


这 完成 了 所 有 的 代码 。 
考虑 到 完整 性 ， 我 们 添加 一 个 makefile 文 件 来 使 你 的 工作 更 为 轻 
松 。 你 可 能 需要 根据 MySQL 安 装 的 情况 来 调整 include 路 径 。 


TEJGTEBUSE TP, Re BIR Se A T RAIERJGUI * BFE 
在 ， 如 果 你 想 观 察 执行 代码 所 引起 的 数据 库 改 变 ， 我 们 建议 你 在 一 个 
窗口 中 运行 gdb 调 试 絮 来 单 步 运 行 代码 ， 同 时 在 男 一 个 窗口 中 观 绎 数据 
库 数 据 的 变化 。 如 果 使 用 MySQL 查 询 浏览 器 ,请 记 住 你 需要 刷新 数据 显 
示 才 能 看 到 数据 的 变化 。 


8.5 AE 


- 


在 本 章 中 ， 我 们 简要 介绍 了 MySQL。 对 于 经 验 丰 富 的 使 用 者 来 
说 ， 他 们 将 发 现 许 多 我 们 没有 时 间 在 本 章 中 讨论 的 高 级 功能 ， 如 外 键 
约束 和 触发 右 。 

你 学 习 了 安装 MySQL 的 基础 知识 ， 并 掌握 了 如 何 通过 客户 端 工具 
对 MySQL 数 据 库 进 行 基本 的 管理 。 我 们 介绍 了 它 的 C 语 言 API 接 口 ， 
这 是 能 与 MySQL 一 起 工作 的 编程 语言 之 一 。 在 此 过 程 中 ， 你 还 学 习 了 
一 些 SQL 语 句 。 

我 们 希望 本 章 能 够 鼓励 你 开始 尝试 使 用 一 个 基于 SQL 的 数据 库 来 
处 理 数 据 ， 并 能 继续 学 习 以 了 解 这 些 强大 的 数据 库 管 理工 具 的 更 多 功 
能 。 


A T te =, MySQL 的 更 多 信息 可 参见 MySQL 主页 
www.mysql.com ° 


第 9 章 FALE 


在 本章 中 我 们 将 介绍 一 些 Linux 系 统 中 的 程序 开发 工具 ， 其 中 
一 些 工 具 也 可 以 在 UNIX 系 统 中 使 用 。Linux 系 统 除 提供 开发 人 员 必 需 
的 编译 器 和 调试 器 外 ， 还 提供 一 组 工具 ， 其 中 每 个 都 可 以 完成 一 件 独 
立 的 任务 ， 并 且 人 允许 开发 人 员 将 它们 创造 性 地 组 合 在 一 起 ， 而 这 种 组 
合 能 力也 是 Linux 从 UNIX 的 哲学 体系 中 继承 而 来 的 。 你 将 在 本 章 中 看 
到 一 些 非常 重要 的 开发 工具 ， 并 将 利用 这 些 工 具 解 决 一 些 实际 问题 。 
这 些 工 具 包 括 : 
make 命 令 和 makefile 文 件 
使 用 RCS 和 CVS 系 统 对 源 代码 进行 控制 
编写 手册 页 
使 用 patch 和 tar 命 令 来 发 布 软件 
开发 环境 


OOOOd 


A] 


9.1 个 源 


在 编写 小 程序 时 ， 许 多 人 都 会 在 编辑 完 产 文件 后 重新 编译 所 有 文 
件 来 重建 应 用 程序 。 但 对 大 型 程序 来 说 ， 使 用 这 种 简单 的 处 理 方 式 会 
带 来 一 些 很 明显 的 问题 。 编 辑 一 编译 一 测试 这 一 循环 的 周期 将 变 长 。 
如 果 仪 改动 了 一 个 源 文件 ， 即 使 是 最 有 耐心 的 程序 员 也 不 想 重 新 编译 
所 有 的 源 文件 。 

如 果 在 程序 中 创建 了 多 个 头 文 件 ， 并 在 不 同 的 源 文 件 中 包含 它 
们 ， 这 种 处 理 方式 就 会 带 来 一 个 潜在 的 、 更 严重 的 问题 。 比 如 说 ， 你 
有 3 个 头 文 件 : a.h、b.h 和 c.h,3 个 C 源 文件 main.c、2.c 和 3.c (我 们 希望 
读者 在 实际 的 项 目 中 为 源 文 件 选择 更 好 的 名 字 ) ,具体 的 情况 如 下 所 
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inciuce 


如 果 程 序 员 只 修改 了 头 文件 ch, 则 源 文件 main.c 和 2.c 无 需 重新 编 
译 ， 因 为 它们 并 不 依赖 于 这 个 头 文件 ， 而 对 于 源 文 件 3.c 来 说 ， 因 为 它 
包含 了 头 文 件 ch, 所 以 在 头 文件 ch 改动 后 ， 就 必须 重新 编译 它 。 但 如 
果 修 改 的 是 头 文 件 b.h, 而 程序 员 义 起 记 重 新 编译 源 文件 2.c, 则 最 终 的 程 
序 束 可 能 无 法 正常 工作 了 。 

make 工 具 可 以 解决 上 述 这 些 问题 ， 它 会 在 必要 时 重新 编译 所 有 受 
改动 影响 的 源 文件 。 


make 命 令 不 仅仅 用 于 编译 程序 ， 无 论 何 时 ， 当 需要 通过 多 个 
输入 文件 来 生成 输出 文件 时 ,你 都 可 以 利用 它 来 完成 任务 。 它 的 其 
他 用 法 还 包括 文档 处 理 (例如 针对 troff 或 TeX 文 档 ) 。 


92 make 命令 和 makefile 


你 将 看 到 ， 虽 然 make 命 令 内 置 了 很 多 智能 机 制 ， 但 光 攒 其 目 吴 是 
无 法 了 解 应 该 如 何 建立 应 用 程序 的 。 你 必须 为 其 提供 一 个 文件 ， 告 诉 
它 应 用 程序 应 该 如 何 构 造 ,这 个 文件 称 为 makefile 。 

makefile 文 件 一 般 都 会 和 项 目的 其 他 源 文件 放 在 同一 目录 下 。 你 的 
机 器 上 可 以 同时 存在 许多 不 同 的 makefile 文 件 。 事 实 上 ， 如 果 管 理 的 是 
目 ， 你 可 以 用 多 个 不 同 的 makefile 文 件 来 分 别管 理 项 目的 不 同 
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make 命 令 和 makefile 文 件 的 结合 提供 了 一 个 在 项 目 管理 领域 十 分 
强大 的 工具 。 它 不 仅 常 被 用 于 控制 源 代码 的 编译 ， 而 且 还 用 于 手册 页 
的 编写 以 及 将 应 用 程序 安 效 到 目标 上 日 录 。 


92.1 ”makefile 的 语法 


makefile 文 件 由 一 组 依赖 天 系 和 规则 构成 。 每 个 依赖 天 系 由 一 个 日 
标 (即将 要 创建 的 文件 ) 和 一 组 该 日 标 所 依赖 的 源 文 件 组 成 。 而 规则 
描述 了 如 何 通过 这 些 依赖 文件 创建 目标 。 一 般 来 说 ， 目 标 是 一 个 单独 
的 可 执行 文件 。 

make 命 令 会 读 取 makefile 文 件 的 内 容 ， 它 先 确定 目标 文件 或 要 创 
建 的 文件 ， 然 后 比较 该 目标 所 依赖 的 源 文件 的 日 期 和 时 间 以 决定 该 采 
用 哪 条 规则 来 构造 目标 。 通 常 在 创建 最 终 的 目标 文件 之 前 ， 它 需要 先 
创建 一 些 中 间 目 标 。make 命 令 会 根据 makefile 文 件 来 确定 目标 文件 的 
创建 顺序 以 及 正确 的 规则 调用 顺序 。 


9.2.2 make 命令 的 选项 和 允 


make 程 序 本 号 有 许多 选项 ， 其 中 最 常用 的 3 个 选项 如 下 所 示 。 

Oo -k: 它 的 作用 是 让 make 命 令 在 发 现 错误 时 仍然 继续 执行 ， 而 
不 是 在 检测 到 第 一 个 错误 时 就 停 下 来 。 你 可 以 利用 这 个 选项 在 一 
次 操作 中 发 现 所 有 未 编译 成 功 的 源 文 件 。 

o -n: 它 的 作用 是 让 make 命 令 输出 将 要 执行 的 操作 步 又， 而 不 
真正 执行 这 些 操作 。 

O -f <filename>: 它 的 作用 是 告诉 make 命 令 将 哪个 文件 作为 
makefile 文 件 。 如 果 未 使 用 这 个 选项 ， 标 准 版 本 的 make 命 令 将 首 


先 在 当前 目录 下 查找 名 为 makefile 的 文件 ， 如 果 该 文件 不 存在 , 它 

束 会 查找 名 为 Makefile 的 文件 。 但 如 果 你 是 在 Linux 系 统 中 ， 你 使 

用 的 可 能 是 GNU Make, 这 个 版 本 的 make 命 令 将 在 搜索 makefile 文 

件 和 Makefile 文 件 之 前 ， 首 先 查 找 名 为 GNUmakefile 的 文件 。 按 惯 

例 , 许 多 Linux 程 序 员 使 用 文件 名 Makefile, 因 为 如 果 一 个 目录 下 都 是 

以 小 写字 母 为 名 称 的 文件 ， 则 Makefile 文 件 将 在 目录 的 文件 列表 

中 第 一 个 出 现 。 我 们 建议 不 要 使 用 文件 名 GNUmakefile, 因 为 它 是 

特定 于 make 命 令 的 GNU 实 现 的 。 

为 了 指示 make 命 令 创 建 一 个 特定 的 目标 (通常 是 一 个 可 执行 文 
件 ) ， 你 可 以 把 该 目标 的 名 字 作 为 make 命 令 的 一 个 参数 。 如 果 不 这 人 么 
做 ，make 命 令 将 试图 创建 列 在 makefile 文 件 中 的 第 一 个 目标 。 许 多 程 
序 员 都 会 在 目 己 的 makefile 文 件 中 将 第 一 个 目标 定义 为 al 然后 再 列 出 
其 他 从 属 目 标 。 这 个 约定 可 以 明确 地 告诉 make 命 令 ， 在 未 指定 特定 目 
Du 默认 情况 下 应 该 创建 哪个 目标 。 我 们 建议 读者 都 坚持 使 用 这 一 
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1. 依赖 关系 

依赖 关系 定义 了 最 终 应 用 程序 里 的 每 个 文件 与 源 文 件 之 间 的 天 
系 。 在 本 章 前 面 的 程序 示例 中 ， 你 可 以 把 依赖 关系 定义 为 最 终 应 用 程 
序 依赖 于 文件 main.o、2.0o 和 3.0。 同 样 ，main.o 依 赖 于 main.c 和 a.h,2.0 
依赖 于 2.c、a.h 和 b.h,3.0o 依 赖 于 3.c、b.h 和 c.h。 因 此 ，main.o 受 文件 
main.c 和 ah 修改 的 影响 ， 如 果 这 两 个 文件 之 一 有 所 改变 ， 你 就 需要 重 
新 编译 main.c 来 重建 main.o。 

在 makefile 文 件 中 ， 这 些 规则 的 写法 是 : 先 写 目标 的 名 称 ， 然 后 紧 
跟着 一 个 冒号 ， 接 着 是 空格 或 制 表 符 tab, 最 后 是 用 空格 或 制 表 符 tab 隔 
开 的 文件 列表 (这 些 文件 用 于 创建 目标 文件 ) 。 与 前 面 例子 相对 应 的 
依赖 天 系列 表 如 下 所 示 : 


main.o: main a.t 
2 a.h b.h 


CRN 目标 myapp 依 赖 于 main.o、2.0 和 3.o, 而 main.o 依 赖 于 main.c 
和 a.h, 等 等 。 

这 组 依赖 关系 形成 一 个 层次 结构 ， 它 显示 了 源 文 件 之 间 的 关系 。 
你 可 以 很 容易 地 看 出 ， 如 果 文 件 b.h 发 生 改 变 ， 你 就 需 重新 编译 2.0 和 
3.0, 而 由 于 2.0o 和 3.0 发 生 了 改变 ,你 还 需要 重新 创建 目标 myapp 。 

如 果 想 一 次 创建 多 个 文件 ， 你 可 以 利用 伪 目 标 all。 假 设 应 用 程序 
T ee ed EUG o 你 可 以 用 下 面 这 行 语句 
进行 定义 : 


这 里 再 次 强调 ， 如 果 未 指定 一 个 all 目 标 , 则 make 命 令 将 只 创建 它 在 
ao a 的 第 一 个 目标 。 
2- | 


makefile 文 件 的 第 二 部 分 内 容 是 规则 ， 它 们 定义 了 目标 的 创建 方 
式 。 在 上 市 的 例子 中 ， 当 make 命 令 人 确定 需要 重建 2.o 时 ， 它 具体 应 该 使 
用 哪 条 命令 呢 ? 看 上 去 只 需 使 用 命令 gcc -c 2.c 就 够 了 (在 后 面 你 将 看 
到 ，make 命 令 内 置 了 很 多 默认 规则 ) ， 但 如 果 需 要 指定 头 文 件 目录 ， 
或 者 为 了 今后 的 调试 需要 设置 符号 信息 选项 又 该 怎么 做 呢 ? 这 就 需要 
在 makefile 文 件 中 明确 定义 一 些 规则 。 


此 时 ， 我 们 必须 提 凡 makefile 文 件 中 一 个 非常 奇怪 而 又 信人 遗 
憾 的 语法 现象 ， 空格 和 制 表 符 tab 是 有 区 别 的 。 规 则 所 在 的 行 必须 
以 制 表 符 tab 开 头 ， 用 空格 是 不 行 的 。 由 于 连续 几 个 空格 和 一 个 制 
表 符 tabb 看 上 去 很 相似 ， 而 且 儿 乎 在 Linux 编 程 的 所 有 领域 中 ， 空 
格 和 制 表 符 tab 之 间 几 乎 没有 差别 ， 所 以 这 样 的 语法 规定 会 市 来 问 
题 。 此 外 ， 如 条 makefile 文 件 中 的 某 行 以 空格 结尾 ， 它 也 可 能 会 寻 
致 make 命 令 执 行 失败 。 但 这 些 都 是 历史 遗留 问题 ， 而 且 因为 已 有 
太 多 的 makefile 文 件 存 在 ， 企 图 将 其 全 部 改正 是 不 现实 的 ， 所 以 请 
小 心 编 写 makefile 文 件 。 幸 运 的 征 ， 如 采 缺 少 了 制 表 符 tab,make 命 
令 束 不 会 正 第 工作 ， 所 以 发 现 这 个 错误 很 容易 。 


Sc 验 一 个 简单 的 makefile 文 件 

大 多 数 规则 都 包含 一 个 简单 的 命令 ， 该 命令 也 可 以 在 命令 行 上 执 
行 。 束 前 面 的 例子 来 说 ， 你 把 创建 的 第 一 个 makefile 文 件 命名 大 
Makefile1: 


myapp: main.o o 3.0 
sce - y a 


你 在 调用 make 命 令 时 加 上 -f 选 项 ， 这 十 因为 makefile 文 件 并 未 使 用 
常见 的 默认 文件 名 makefile 或 Makefile。 如 果 在 一 个 没有 任何 源 文件 的 
目 孙 下 执行 这 个 命令 ， 你 束 会 得 到 如 下 的 输出 结果 : 


$ make -f Makefilel 
make: *** No rule to mak 


e target 'main.c needed by 'main.o' Stop. 


make 命 令 假设 在 makefile 文 件 中 的 第 一 个 目标 myapp 是 想 创建 的 目 
标 文件 。 然 后 它 会 检查 其 他 的 依赖 和 关系， 并 确定 需要 有 一 个 名 为 
main.c 的 文件 。 由 于 并 未 创建 该 文件 ，makefile 文 件 里 也 未 说 明 如 何 创 
建 该 文件 ， 所 以 make 命 令 报 告 一 个 错误 。 下 面 束 来 创建 这 些 源 文 件 并 
重新 进行 尝试 。 由 于 对 程序 执行 的 结果 没有 兴趣 ， 所 以 这 些 文件 的 内 
ca 。 头 文件 实际 上 都 是 空 文件 ， 你 可 以 用 touch 命 令 来 创建 
它们 : 


$ touch a.h 
$ touch b.h 
$ touch c.h 


JR XC £F main.c F E & main AL, 3X ES Beal H T function two I 
function three 函数 ， 而 这 两 个 函数 分 别 在 另外 两 个 文件 中 定义 。 源 文 
件 通过 其 nclude 语 名 包含 合适 的 头 文 件 ， 使 它们 看 上 去 依赖 于 这 些 头 文 
件 的 内 容 。 它 其 实 算 不 上 是 一 个 应 用 程序 ， 下 面 是 其 程序 清单 : 


void function_three() { 
} 


再 次 执行 make 命 令 : 


$ make -f Makefilel 
gcc -c main.c 
gcc -c 2.c 
gcc -c 3.¢ 
gcc -o myapp main.o 2.0 3.o 
9 
这 次 成 功 执行 了 make 命 令 。 
实验 解析 
make 命 令 处 理 makefile 文 件 中 定义 的 依赖 关系 ， 确 定 需要 创建 的 
文件 以 及 创建 顺序 。 虽 然 把 如 何 创 建 目 标 myapp 列 在 最 前 面 ， 但 make 
命令 能 够 自行 判断 出 创建 文件 的 正确 顺序 。 它 调用 你 在 规则 部 分 给 出 
的 命令 来 创建 相应 的 文件 ， 同 时 会 在 执行 时 在 屏幕 上 将 命令 显示 出 
来 。 dia 你 可 以 测试 在 文件 b.h 改 变 时 ，makefile 文 件 能 否 正确 处 理 
这 一 情况 : 


$ touch b.h 
; make -f Makefilel 


make 命 令 读 取 makefile 文 件 ， 确 定 重 建 myapp 所 需 的 最 少 命令 ， 并 
ay M 下 面 我 们 来 看 ， 如 果 删 除 一 个 目标 文件 会 发 
人 情况: 


make 命 令 再 次 正确 地 确定 出 和 需要 采取 的 动作 。 


My 


9.2.3 makefile Ji 


makefile 文 件 中 的 注释 以 # 号 开头 ， 一 直 延 续 到 这 一 行 的 结束 。 和 
C 语 言 源 文件 中 的 注释 一 样 ， makefile 文 件 中 的 注释 可 以 帮助 程序 的 编 
写 者 及 其 他 人 理解 最 初 编写 这 个 文件 的 目的 。 


9.2.4 makefile JE 


即使 上 述 内 容 就 是 make 命 令 和 makefile 文 件 的 全 部 ， 对 于 管理 包 
含 多 个 源 文 件 的 项 目 来 说 ， 它 们 仍然 是 强 有 力 的 工具 。 但 是 ， 对 于 管 
理 包 含 非常 多 源 文 件 的 大 型 项 目 来 说 ， 它 们 就 显得 过 于 庞大 并 缺乏 弹 
。 因 此 ，makefile 文 件 允 许 你 使 用 宏 以 一 种 更 通用 的 格式 来 书写 它 
| o 

你 通过 语句 MACRONAME=value 在 makefile 文 件 中 定义 宏 ，3 引 用 
宏 的 方法 是 使 用 $ (MACRONAME) 2%${MACRONAME} © make 的 
某 些 版 本 还 接受 $MACRONAME 的 用 法 。 如 果 想 把 一 个 宏 的 值 设置 为 
空 ， 你 可 以 令 等 号 (=) 后 面 留 空 。 

makefile 文 件 中 的 宏 常 被 用 于 设置 编译 器 的 选项 。 在 软件 的 开发 过 
程 中 ， 通 常 开 发 人 员 不 会 对 编译 结果 进行 优化 ， 而 是 将 调试 信息 包含 
进去 。 但 对 于 软件 的 发 行 版 ， 往 往 又 需 反 过 来 做 ， 即 编译 结果 是 一 个 
n 使 其 执行 速度 尽 可 
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Makefilel 文 件 的 另 一 问题 是 ， 它 假设 编译 器 的 名 字 是 gcc, 而 在 其 
他 UNIX 系 统 中 ， 编 译 器 的 名 字 可 能 是 CC 或 c89。 如 果 想 将 makefile 文 
件 移植 到 另 一 版 本 的 UNIX 系 统 中 ， 或 在 现 有 系统 中 使 用 另 一 个 编译 
器 ， 为 了 使 其 工作 ， 你 将 不 得 不 修改 makefile 文 件 中 许多 行 的 内 容 。 安 
是 用 来 收集 所 有 这 些 与 系统 相关 内 容 的 好 方法 ， 通 过 使 用 宏 定 义 ， 你 
可 以 方便 地 修改 这 些 内 容 。 

宏 通常 都 是 在 makefile 文 件 中 定义 的 ， 但 你 也 可 以 在 调用 make 命 
令 时 在 命令 行 上 给 出 宏 定 义 ， 例 如 命令 make CC=c89。 命令 行 上 的 安 
定义 将 上 覆盖 在 makefile 文 件 中 的 安定 义 。 当 在 makefile 文 件 之 外 使 用 安 
定义 时 ， 要 注意 宏 定义 必须 以 单个 参数 的 形式 传递 ， 所 以 应 避免 在 安 
定义 中 使 用 空格 或 应 像 下 面 这 样 给 宏 定 义 加 上 引号 : make 
“CC=c89” » 


X 验 带 宏 定义 的 makefile 文 件 
下 面 是 makefile 文 件 的 一 个 修订 版 本 Makefile2, 它 使 用 了 一 些 宏 定 
X 


4 Which compile 
gcc 
re d tept 
INCLUDE = . 
Opti for developse 
FLAGS Wali -anai 
prior eas 
FLAG Wall i 
myapp: ma o 2.0 3.6 
$1 myapp main.o 3 


UDE) S(CFLAGS) -c 2.c 


LUDE) § (CFLAGS) 


HIPRIA RCE, Frid Seri makefile SC fT- 818890 B] 27286 C 
件 ， 你 将 看 到 如 下 的 输出 : 


5 make -f Makefile2 
: [. -g -Wall -ans 


i -g -Wali -ansi -c 3 


实验 解析 

make 命 令 将 $ (CC) `$ (CFLAGS) 和 $ (INCLUDE) 替换 为 相 
应 的 宏 定义 ， 这 与 C 语 言 编译 器 对 #define 语 名 的 处 理 方式 很 相似 。 现 
在 ， 如 果 想 改变 编译 器 命令 ， 你 只 需 修 改 makefile 文 件 中 的 一 行 即 可 。 

事实 上 ，make 命 令 内 置 了 一 些 特殊 的 安定 义 ， 通 过 使 用 它们 ， 你 
可 以 让 makefile 文 件 变 得 更 加 简洁 。 我 们 将 几 个 较 常 用 的 宏 列 在 表 9-1 
中 ， 其 使 用 方法 可 以 在 后 面 的 示例 中 看 到 。 这 些 宏 在 使 用 前 才 展 开 ， 
所 以 它们 的 含义 会 随 着 makefile 文 件 的 处 理 进展 而 发 生变 化 。 事 实 上 ， 
如 果 这 些 内 置 宏 的 用 法 不 是 这 样 ， 它 们 就 没有 什么 用 处 了 。 


X 9-1 


£ tf X 
^N Hd OR PELAGI SEU e CPGE XE 
"am Had sy 
"M HORE Pe HF 
FARES ARAT 


在 makefile 文 件 中 ， 你 可 能 还 会 看 到 下 面 两 个 有 用 的 特殊 子 符 ， 它 
们 出 现在 命令 之 前 

O -: 告诉 make 命 令 忽 上 略 所 有 错误 。 例 如， 如 有 果 想 创建 一 个 目 

X, {ASCH 忽略 任何 错误 (比如 目录 已 存在 ) ， 你 就 可 以 在 mkdir 

cana ,你 将 在 本 章 后 面 的 例子 中 看 到 符号 -的 

@: 告诉 make 在 执行 某 条 命令 前 不 要 将 该 命令 显示 在 标准 和 输 

AE. MR ede RAS - 些 说 明 信 息 ， 这 个 字符 将 非 第 有 


9.2.5 个 目标 


通常 制作 不 止 一 个 目标 文件 或 者 将 多 组 命令 集中 到 一 个 位 置 来 执 
行 是 很 有 用 的 。 你 可 以 通过 扩 展 makefile 文 件 来 达到 这 一 目的 。 在 下 面 
的 例子 中 ， 你 在 makefile 文 件 中 增加 一 个 clean 选 项 来 删除 不 需要 的 目 
增加 一 个 install 移 项 来 将 编译 成 功 的 应 用 程序 安装 到 为 一 个 目 


实 验 多 个 目标 
下 面 是 makefile 文 件 的 下 一 个 版 本 Makefile3 文 件 的 内 容 : 


这 个 makefile 文 件 中 有 几 处 需要 注意 。 首 先 ， 特 殊 目 标 al 仍然 只 指 
定 了 myapp 这 一 个 目标 。 因 此 ， 如 果 在 执行 make 命 令 时 未 指定 目标 ， 
它 的 默认 行为 就 是 创建 目标 myapp。 

下 一 个 值得 关注 之 处 就 是 两 个 新 增加 的 目标 : clean 和 install e H 
标 clean 用 rm 命令 来 删除 日 标 文件 。rm 命 令 以 减 号 - 开 涉 ， 减 号 的 舍 义 
是 让 make 命 令 忽 上 略 rm 命 令 的 执行 结果 ， 这 意味 着 ， 即 使 由 于 目标 文件 
不 存在 而 导致 rm 命令 返回 错误 ， 命 令 make clean 也 会 成 功 。 用 于 制作 
目标 clean 的 规则 并 未 给 目标 clean 定 义 任 何 依赖 关系 ， 行 clean: 的 后 面 
是 空 的 ， 因 此 该 目标 总 被 认为 是 过 时 的 ， 所 以 在 执行 make 命 令 时 ， 如 
果 指 定 目标 clean, 则 该 目标 所 对 应 的 规则 将 总 被 执行 。 

目标 instal 依赖 于 myapp, 所 以 make 命 令 知道 它 必 须 首 移 创 建 
myapp, 然 后 才能 执行 制作 该 目标 所 需 的 其 他 命令 。 用 于 制作 install 目标 
的 规则 由 几 个 shell 脚 本 命令 组 成 。 由 于 make 命 令 在 执行 规则 时 会 调用 
一 个 shell, 并 有 旦 会 针对 每 个 规则 使 用 一 个 新 shell, 所 以 必须 在 上 面 每 行 代 
码 的 结尾 加 上 一 个 反 和 斜 杠 \， 让 所 有 shell 脚 本 命令 在 逻辑 上 处 于 同一 
行 ， 并 作为 一 个 整体 传递 给 一 个 shell 执 行 。 这 个 命令 以 符号 @ 开 头 ， 
表示 make 在 执行 这 些 规则 之 前 不 会 在 标准 输出 上 显示 命令 本 里。 

目标 install 按 顺序 执行 多 个 命令 将 应 用 程序 安装 到 其 最 终 位 置 。 它 
并 没有 在 执行 下 一 个 命令 前 检查 前 一 个 命令 的 执行 是 否 成 功 。 如 果 这 
点 很 重要 ， 你 可 以 将 这 些 命令 用 符号 && 连 接 起 来 ， 如 下 所 示 : 


Orr 


大 家 应 该 记得 ， 我 们 曾经 在 第 2 章 见 过 该 符号 ， 对 shell 来 说 ， 它 
是 “与 ”的 意思 ， 即 每 个 后 续 命 令 只 在 前 面 的 命令 都 执行 成 功 的 前 提 下 
才 会 被 执行 。 在 此 例 中 ， 你 并 不 过 分 天 心 前 面 的 命令 是 否 执行 成 功 ， 
所 以 可 以 坚持 使 用 简单 的 格式 。 

你 可 能 不 能 以 普通 用 户 的 届 份 将 新 命令 安装 到 目录 /usr/local/bin 
下 。 在 执行 命令 make install 之 前 ， 你 可 以 修改 makefile 文 件 以 选择 男 一 
个 安装 目录 ， 或 是 改变 该 目录 的 权限 ， 或 是 通过 命令 su 切换 用 户 喘 份 
到 超级 用 户 root 。 


> rm *.o myapp 
$ make -f Makefile3 
J z Wa -an 


joe - yopi in 2 
$ make -f Makefile} 
make: Nothing to be d 
$ rm mya 


bP 
$ make -f Makefile} install 
gcc myapp main a 


In talled z ier Å ai Din 
5 make -f Makefile} clean 
mm maín.c 


实验 解析 

首先 ， 删 除 myapp 和 所 有 目标 文件 。 单 独 执行 make 命 令 的 话 ， 它 
将 使 用 默认 目标 all, 并 创建 可 执行 程序 myapp。 然 后 再 次 运行 make 命 
令 ， 但 因为 myapp 已 经 是 最 新 的 ， 所 以 make 命 令 未 做 任何 事 。 接 下 
来 ， 删 除 文件 myapp 并 执行 命令 make install, 它 重新 创建 二 进 制 文件 
myapp 并 将 其 复制 到 安装 目录 中 。 最 后 ， 运 行 命令 make clean 来 删除 当 
前 目录 下 所 有 的 目标 文件 。 


9.2.6 ”内 置 规则 


目前 为 止 ， 你 在 makefile 文 件 中 对 每 个 操作 步 又 的 执行 都 做 了 精确 
的 说 明 。 事 实 上 ，make 命 令 本 吴 市 有 大 量 的 内 置 规则 ， 写 们 可 以 极 大 
地 简化 makefile 文 件 的 内 容 ， 尤 其 在 拥有 许多 源 文 件 时 更 是 如 此 。 为 测 


2 
Y: 


( 
printf|'Heilo Worldin* 
*ITUIT Cn^Pceo 


在 不 指定 makefile 文 件 时 ， 党 试用 make 命 令 来 编译 它 : 


make foo 


可 以 看 到 ，make 命 令 知 道 如 何 调 用 编译 右 ， 虽 然 此 例 中 ， 它 选择 
的 是 cc 而 不 是 gcc (在 Linux 系 统 中 ， 这 没有 问题 ， 因 为 CC 通常 是 gcc 的 
一 个 连接 文件 ) 。 有 了 时， 这 些 内 置 规则 又 被 称 为 推导 规则 ， 由 于 它们 
都 会 使 用 宏 定义 ， 因 此 可 以 通过 给 宏 赋 予 新 值 来 改变 其 默认 行为 。 


你 可 以 通过 -p 选 项 让 make 命 令 打 印 出 其 所 有 内 置 规 则 。 由 于 内 置 
规则 实在 太 多 ， 不 能 在 此 一 一 列 出 ， 所 以 这 里 只 给 出 了 GNU 版 本 make 
的 make -p 命 令 的 部 分 输出 ， 显 示 了 其 中 一 部 分 的 规则 : 


考虑 到 存在 这 些 内 置 规则 ， 你 可 以 将 文件 makefile 中 用 于 制作 目标 
的 规则 去 择 ， 而 只 需 指定 依赖 关系 ， 从 而 达到 简化 makefile 文 件 的 目 
的 。 因 此 该 文件 中 相应 部 分 的 内 容 将 变 得 很 测 单 ， 如 下 所 示 : 


-a.hn 5.F 


读者 可 以 在 本 书 所 对 应 的 网 站 下 载 代码 中 找到 这 个 版 本 的 makefile 
文件 Makefile4。 


9.2/7 “后 缀 和 模式 规则 


你 看 到 的 内 置 规则 在 使 用 时 都 利用 了 文件 的 后 缀 名 (这 类 似 
Windows 和 MS-DOS 的 文件 扩展 名 ) ， 所 以 当 给 出 市 有 茶 个 特定 后 级 
名 的 文件 时 ，make 命 令 知 道 应 该 用 哪个 规则 来 创建 带 有 男 一 个 不 同 后 


BE A SCR ^ sgh LAN ei BLU) EA FIT CAR SY CF G1] 
建 出 一 个 以 .o 为 后 缀 名 的 文件 。 该 规则 使 用 编译 器 进行 编译 ， 但 并 不 
对 源 文件 进行 链接 。 

有 时 ， 你 需要 自己 创建 新 规则 。 我 过 去 在 日 常 工 作 中 经 常 需 要 用 
多 个 不 同 的 编译 器 对 源 文 件 进行 编译 其 中 两 个 是 MS-DOS 下 的 编译 
絮 ， 一 个 是 Linux 下 的 gcc。 为 了 让 其 中 一 个 MS-DOS 编 译 絮 能 够 正常 
工作 ， 源 文件 (它们 用 的 是 C++ 语 言 而 不 是 C 语 言 ) BEL cpp R 
名 。 但 糟糕 的 是 ， 那 个 时 候 的 Linux 系 统 下 的 make 版 本 没有 用 于 编译 
后 级 名 为 .cpp 的 源 文件 的 内 置 规 则 ( 它 倒是 有 一 条 针对 .cc 源 文件 的 规 
则 ，UNIX 系 统 中 的 C++ 文件 常 使 用 这 个 后 缀 和 名) 。 

为 解决 这 个 问题 ， 或 者 为 每 个 单独 的 源 文件 指定 一 条 规则 ， 或 者 
为 make 制 定 一 条 新 的 规则 ， 专 门 用 于 从 后 缀 名 为 .cpp 的 源 文件 创建 目 
标 文件 。 假 设 这 个 项 目 中 的 源 文 件数 量 非常 大 ， 那 么 制定 一 条 新 规则 
将 节省 大 量 的 键入 时 间 ， 也 使 得 为 该 项 目 增加 新 的 源 文 件 变 得 更 加 容 

要 想 增 加 一 条 新 的 后 级 规则 ， 首 先 需 要 在 makefile 文 件 中 增加 一 行 
语句 ， 告 诉 make 命 令 这 个 新 的 后 缀 名 。 然 后 即 可 用 这 个 新 的 后 缀 名 来 
定义 规则 。make 使 用 特殊 语法 : 


.«old suffix».«new suffix»: 


.«old suffix». «new suffix» : 

AE XE SRL UI, A ALY RT ri IH Js R BJ SL GU 
建 市 有 新 后 组 名 的 文件 ， 并 保留 原文 件 的 前 半 部 分 。 

下 面 是 makefile 文 件 的 一 个 片段 ， 它 用 一 个 新 的 通用 规则 将 .cpp 文 
件 编译 为 .0 文件 : 

特殊 依赖 天 系 .cpp.o: 告诉 make, 紧 随 其 后 的 规则 是 用 于 将 后 绥 和 名 
为 .cpp 的 文件 转换 为 后 缀 名 为 .0 的 文件 。 在 定义 这 个 依赖 关系 时 ， 使 用 
了 特殊 的 宏 名 称 ， 这 是 因为 此 时 你 还 不 知道 将 要 被 转换 的 文件 的 名 
字 。 要 想 理解 这 条 规则 ， 只 需要 记 住 安 $< 将 被 扩 展 为 起 始 文件 的 名 字 
(包含 月 的 后 绥 名 ) 。 注 意 ， 只 需 告诉 make 如 何 从 .cpp 文 件 得 到 .o 文 


当 调 用 make 命 令 时 ， 它 将 使 用 这 条 新 规则 从 bar.cpp 文 件 得 到 bar.o 
文件 ， 然 后 再 使 用 它 的 内 置 规则 从 .o 文 件 得 到 二 进 制 可 执行 文件 。- 
XC++ 标 志 的 作用 是 告诉 gcc 编 译 器 这 是 一 个 C++ 源 文件 。 


3 IS(INCLUDE) -c $< 


如 今 的 make 版 本 已 知道 如 何 处 理 后 缀 名 为 .cpp 的 C++ 源 文件 了 ， 
pr ee ee XS BUND 
INÍ ] 

最 新 的 make 版 本 还 包含 一 个 新 的 语法 以 实现 同样 的 效果 ， 而 且 功 
能 更 强大 。 例 如 ， 模 式 规则 可 以 用 % 通 配 符 语法 来 匹配 文件 名 ， 而 不 
征 仅 依赖 于 文件 的 后 缀 名 。 

可 以 达到 与 上 例 中 .cpp 规 则 同样 效果 的 模式 规则 如 下 所 示 : 


“++ SICFLAGS IS(INCLUDE) -c $< 


9.2.8 make Ẹ H 


对 于 大 型 项 目 ， 一 种 比较 方便 的 做 法 是 用 函数 库 来 管理 多 个 编译 
产品 。 函数 库 实际 上 就 是 文件 ， 它 们 通常 以 .a (a 是 英文 archive 的 首 字 
Bk) 为 后 缀 名 ， 在 该 文件 中 包含 了 一 组 目标 文件 。make 命 令 用 一 个 特 
殊 的 语法 来 处 理 函 数 库 ， 这 使 得 钞 数 库 的 管理 工作 变 得 非常 容易 。 

用 于 管理 函数 库 的 语法 是 lib (file.o) , 它 的 含义 是 目标 文件 fie.o 是 
存储 在 函数 库 lib.a 中 的 。 make 命 令 用 一 个 内 置 规则 来 管理 函数 库 ， 该 
规则 的 常见 形式 如 下 所 示 : 


S{(CFLAGS) $< 


AR) S(ARFLAGS 


Æ$ (AR) 和 $ (ARFLAGS) 的 默认 取 值 通常 分 别 是 命令 ar 和 选 
项 rv。 这 个 相当 简洁 的 语法 告诉 make, 要 想 从 .c 文 件 得 到 .a 库 文件 ， 它 
必须 应 用 上 面 两 条 规则 。 

o 第 一 条 规则 告诉 它 必须 编译 源 文 件 以 生成 目标 文件 。 

o “第 二 条 规则 告诉 它 用 ar 命令 将 新 的 目标 文件 添加 到 函数 库 中 。 

因此 ， 如 果 有 一 个 名 为 包 d 的 函数 库 ， 其 中 包含 目标 文件 bas.o, 则 
第 一 条 规则 中 的 $< 将 被 奉 换 为 bas.c, 而 第 二 条 规则 中 的 $@ 和 $* 将 被 分 
别 殖 换 为 库 文件 fad.a 和 和 名字 bas。 


x 验 管理 函数 库 

在 实际 应 用 中 ， 管 理 函 数 库 规则 的 使 用 非常 简单 。 下 面 将 文件 2.0 
和 3.0 放 入 函数 库 mylib.a 中 。 你 只 需 对 makefile 文 件 做 很 少 的 修改 ， 最 
终 的 makefile 文 件 Makefile5 如 下 所 示 : 


@ Which compiler 


ë here t n a 
DIR "al 
a de r 
INCLU 
è jpm 
-FLAK Wall -ans 
® Options for release 
hi CFLAGS = Wal ansi 


1 Local Libraries 
MYLIB = mylib.a 


myapp: main.o $!MYLIB) 
$(CC] -o myapp main.o $(MYLIB) 


$(MYLIB): $IMYLIB) (2.0) ${MYLIB) (3.0) 
main.o: main.c a.h 

2.0: 2.0 a.h b.h 

3.0: 3.c b.h c.h 


ciean: 
-rm main.o 2.0 3.0 S(MYLIB) 


stall: myapr 
vif a $ f 
the 
ryapp T d 
wnod a&*x TD IRI myapp 
i og-w NSTDIR) /myapp: 
} f $ [ZNSTDIR 


请 注意 ， 我 们 是 如 何 利用 默认 规则 来 完成 大 部 分 工作 的 。 下 面 测 
试 这 个 新 版 本 的 makefile 文 件 : 


5 rm -f myapp *.o mylib.a 
5 make =f MakefilesS 
JCC g ansi > =O main | main.c 


jcc -g -Wall -ansi 


goc -o myapp main.o mylib.a 
$ touch c.h 
> make -f Makefile5 
2c -g -Wall ansi 
ar rv mylib.a 1. 


myapp main.o myiib.a 


实验 解析 
Eis. 删除 所 有 的 目标 文件 和 库 文 件 ， 然 后 执行 make 命 令 创 建 
myapp ° make 命 令 首 先 编译 并 创建 钞 数 库 ， aE a o 和 该 函数 库 


链接 起 来 以 创建 myapp。 接 下 来 测试 目标 3.0 的 依赖 规则 ， 它 告诉 make 
命令 ， 当 文件 ch 发 生 改变 时 ， 源 文件 3.c 必 须 被 重新 编译 。make 命 令 
正确 地 完成 了 这 一 工作 ， 它 站 先 编译 源 文件 3.c, 然 后 更 新 画 数 库 ， 最 后 
重新 链接 函数 库 并 创建 一 个 新 的 可 执行 文件 myapp。 


9.2.9 级 主题 : makefile 


对 于 大 型 的 项 目 ， 有 时 我 们 和 希望 能 把 构成 一 个 函数 库 的 几 个 文件 
从 主 文 件 中 分 离 出 来 ， 并 将 它们 保存 到 一 个 子 目录 中 。 使 用 make 命 令 
完成 这 一 工作 的 方法 有 两 个 。 

第 一 个 方法 是 ， 你 可 以 在 子 目录 中 编写 出 第 二 个 makefile 文 件 ， 它 
的 作用 是 编译 该 子 目 孙 下 的 源 文件 ， 并 将 它们 保存 到 一 个 函数 库 中 ， 
然后 将 该 库 文 件 复制 到 上 一 级 的 主 目录 中 。 在 主 目录 中 的 makefile 文 
Se ole 于 制作 函数 库 的 规则 ， 该 规则 会 调用 第 二 个 makefile 文 

, A 7: 


my 


这 就 是 说 ， 你 必须 总 是 执行 命令 make mylib.a。 当 make 命 令 调 用 
这 条 规则 来 创建 钞 数 库 时 ， 它 将 切换 到 子 目 录 mylibdirectory 中 ， 然 后 
调用 一 个 新 的 make 命 令 来 管理 函数 库 。 由 于 make 会 针对 每 个 命令 调用 
一 个 新 的 shell, 而 使 用 第 二 个 makefile 文 件 的 make 命 令 本 身 义 并 没有 执 
行 cd 命 令 ， 但 它 又 必须 在 一 个 不 同 的 目录 下 创建 钞 数 库 ， 为 解决 这 一 
问题 ， 我 们 用 括号 将 这 两 个 命令 括 起 来 ， 从 而 确保 它们 只 被 一 个 单独 
的 shell 处 理 。 

第 二 个 方法 是 ， 在 原来 的 makefile 文 件 中 添加 一 些 宏 。 新 添加 的 宏 
通过 在 我 们 已 见 过 的 宏 的 尾部 追加 一 个 字母 得 到 ,字母 D 代 表 目 录 , 字 和 母 
o o fX Ja MOL Ay AA P ERAL R E H N E S c.o) 28 3 
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这 条 规则 的 作用 十 : 编译 子 目 孙 中 的 源 文 件 并 将 目标 文件 放 在 该 子 目 
a 。 然 后， 你 用 如 下 的 依赖 关系 和 规则 来 更 新 当前 目 孙 下 的 函数 
È. 


myiib.a mydir/2.0 mydir/3. 


rv mylit 


在 项 目 中 究竟 使 用 哪 种 方法 是 由 读者 决定 的 。 许 多 项 目 避 免 使 用 
子 目录 ， 但 这 将 导致 在 主 目录 中 存在 大 量 的 源 文 件 。 可 以 从 上 面 的 简 


介 中 看 到 ， 你 只 需要 为 makefile 文 件 稍微 增加 一 点 复杂 性 ， 即 可 在 
make 命 令 中 使 用 子 目 永 。 


9.2.10 GNU make 和 gcc 


GNU 的 make 命 令 和 GNU 的 gcc 编 译 器 有 下 面 两 个 有 趣 的 选项 。 

o 第 一 个 选项 是 make 命 令 的 -jjN (字母 j 是 英文 单词 jobs 的 首 字 
EE) 选项 ， 它 允许 make 命 令 同 时 执行 N 条 命令 。 如 果 项 目的 不 同 
部 分 可 以 彼此 独立 地 进行 编译 ，make 命 令 就 可 以 同时 调用 几 条 规 
则 。 根 据 系统 的 配置 情况 ， 这 种 做 法 可 以 极 大 地 缩短 重新 编译 所 
需要 花费 的 时 间 。 如 果 有 许多 源 文 件 ， 这 个 选项 就 值得 一 试 。 一 
般 来 说 ， 你 可 以 先 从 较 小 的 数字 〈 比 如-j3) 开始 党 试 。 但 如 果 需 
要 与 其 他 用 户 共享 你 的 计算 机 ， 了 驶 要 小 心 使 用 这 个 选项 ， 因 为 其 
他 用 户 可 能 并 不 喜欢 你 每 次 编译 时 都 启动 大 量 的 进程 。 

口 “ 另 一 个 有 用 的 选项 是 gcc 的 -MM 选 项 。 它 的 作用 是 产生 一 个 适 
用 于 make 命 令 的 依赖 关系 清单 。 如 果 某 个 项 目 包含 非常 多 的 源 文 
件 ， 每 个 源 文 件 又 包含 不 同 的 头 文件 组 合 ， 则 理 清 它 们 之 间 的 依 
赖 关 系 将 非常 困难 (但 又 非常 重要 ) 。 如 果 让 每 个 源 文件 都 依赖 
于 所 有 的 头 文 件 ， 有 时 候 你 就 会 编译 一 些 没 有 必要 编译 的 文件 。 
但 从 男 一 方面 来 看 ， 如 果 忽 上 略 一 些 依 赖 天 系 ， 问 题 会 变 得 更 严 
重 ， 因 为 你 没有 重新 编译 一 些 需 要 编译 的 文件 。 


实 验 gcc -MM 
C ， 你 用 gcc 的 -MM 选项 来 生成 上 面 示例 项 目 中 的 依赖 
Ala: 


gcc -MM main.c 2.c 3.c 


实验 解析 

gcc 编 译 器 扫描 源 文件 以 查找 include 语 句 ， 然 后 以 一 种 适合 于 直接 
插入 到 makefile 文 件 中 的 格式 输出 需要 的 依赖 天 系 清单 。 你 只 需 先 把 这 
个 输出 结果 保存 到 一 个 临时 文件 中 ， 然 后 把 它们 插入 到 makefile 文 件 
中 ， 即 可 得 到 一 组 完美 的 依赖 关系 规则 。 如 采 拥 有 gcc 编 译 器 ， 却 还 出 
现 依 赖 关 系 的 错误 就 不 应 该 了 ! 

如 果 你 对 制作 makefile 文 件 非常 有 信心 ， 也 可 以 演 试 使 用 
makedepend 工 具 ， 它 的 功能 与 -MM 选项 很 类 似 ， 但 其 做 法 是 将 依赖 关 


系 直 接 附加 到 指定 的 makefile 文 件 的 末尾 。 

在 结束 对 makefile 文 件 的 介绍 之 前 ， 我 们 有 必要 指出 makefile 文 件 
并 不 仅 用 于 编译 源 代 码 或 创建 画 数 库 。 只 要 是 可 以 通过 一 系列 命令 从 
某 些 类 型 的 输入 文件 得 到 输出 文件 的 任务 ， 你 都 可 通过 makefile 文 件 来 
目 动 地 完成 。 一 个 典型 的 “ 非 编译 器 ”用途 是 ， 通 过 调用 awk 或 sed 命 令 
对 一 些 文件 进行 处 理 ， 或 甚至 通过 makefile 文 件 来 生成 使 用 手册 。 你 可 
以 通过 它 对 任何 与 文件 操纵 相关 的 任务 进行 自动 化 处 理 ， 只 要 make 命 
令 可 以 根据 文件 的 日 期 和 时 间 信 息 判 断 出 哪个 文件 发 生 了 改变 即 可 。 

另 一 种 用 于 控制 程序 创建 或 完成 其 他 上 自动 化 任务 的 工具 是 ANT。 
它 是 一 个 基于 Java 的 工具 ， 它 使 用 基于 XML 的 配置 文件 。 这 个 工具 并 
不 常 被 用 于 目 动 化 处 理 Linux 系 统 上 C 语 言 文件 的 创建 ， 所 以 我 们 不 会 
在 这 里 对 它 作 进一步 的 介绍 。 你 可 以 通过 网 址 http://ant.apache.org 找 到 
有 关 ANT 的 详细 资料 。 
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如 果 你 做 的 不 是 一 个 人 简单 的 项 目 ， 特 别 是 项 目的 开发 人 员 不 止 一 
个 时 ， 为 避免 文件 修改 的 冲突 并 跟 踊 对 源 文 件 所 作出 的 修改 ， 对 源 文 
件 改动 方面 的 管理 职 变 得 非常 重要 o 

UNIX 中 有 几 个 被 广泛 使 用 的 用 于 管理 源 文件 的 系统 ， 如 下 所 示 。 

O SCCS: 源 代码 控制 系统 。 

O RCS: 版 本 控制 系统 。 

口 CVS: 并 发 版 本 控制 系统 。 

[] Subversion ° 

SCCS 是 由 AT&T 在 系统 V 版 本 的 UNIX 中 引入 的 最 初 的 源 代码 控制 
系统 ， 现 在 它 已 是 X/Open 标准 的 一 部 分 了 。RCS 是 在 这 之 后 开发 的 ， 
它 作为 SCCS 的 一 个 免费 替换 系统 ， 由 目 由 软件 基金 会 发 布 。RCS 的 功 
能 与 SCCS 非 常 类 似 ， 但 它 有 着 更 直观 的 接口 和 一 些 其 他 的 选项 ， 所 以 
SCCS 基 本 上 已 被 RCS 所 取代 。 

RCS 工 具 是 Linux 发 行 版 中 的 一 个 常见 套件 ， 你 也 可 以 从 目 由 软件 
基金 会 的 网 址 http:/directory.fsf.org/rcs.html 上 下 载 它 及 其 源 代码 。 

CVS 是 一 个 比 SCCS 和 RCS 更 高 级 的 工具 ， 它 用 于 基于 互联 网 的 协 
同 开 发 。 你 可 以 在 大 多 数 Linux 发 行 版 中 找到 它 ， 你 也 可 以 通过 网 址 
http:/www.nongnu.org/cvs/ FÆ E ° 4 RCSTHEIL, ERAT EAH 
3$. 可 以 通过 网 络 使 用 ， 并 且 人 允许 并 发 开发 。 

Subversion 是 一 个 新 开发 的 工具 ， 它 虽 在 最 终 奉 换 CVS。 它 的 主页 
是 http://www.subversion.org ° 

在 本 章 中 ， 我 们 将 重点 介绍 RCS 和 CVS。 介 绍 RCS 是 因为 它 对 个 
人 的 开发 项 目 来 说 易于 使 用 ， 并 且 它 与 make 整 合 得 很 好 。 介 绍 CVS 是 
因为 它 是 用 于 合作 项 目的 最 常见 的 源 代码 控制 形式 。 鉴 于 SCCS 作 为 
POSIX 标 准 的 地 位 ， 我 们 还 将 简要 地 比较 RCS 命 令 和 SCCS 命 令 ， 并 对 
CVS 和 Subversion 中 的 一 些 用 户 命 令 进 行 比较 。 


9.3.1 RCS 
版 本 控制 系统 (RCS) 提供 了 许多 用 于 管理 源 文件 的 命令 。 它 能 


够 跟 踩 并 记 杂 下 源 文件 的 每 一 次 改动 ， 并 将 这 些 改 动 都 记录 在 一 个 文 
件 中 ， 该 文件 中 记录 的 改动 信息 足够 详细 ， 你 可 以 通过 这 些 信 息 重建 


出 任何 一 个 以 前 的 版 本 。 它 还 允许 你 为 每 次 改动 保存 一 个 与 之 对 应 的 
注释 信息 ， 这 对 了 解 文件 改动 的 历史 非常 有 用 。 

随 着 项 目的 进展 ， 你 可 以 将 每 次 对 源 文件 进行 的 大 的 改动 或 漏洞 
的 修补 分 别 进行 记录 ， 并 针对 每 次 改动 保存 注释 。 当 需要 回顾 对 文件 
= ` RAMARNA 8 LAN iS REST, E E 


因为 RCS 只 你 存 版 本 之 间 的 不 同 之 处 ， 所 以 它 非常 节省 存储 空 
li] » 人 了 文件 ，RCS 还 可 以 帮助 你 找 回 以 前 的 版 本 。 

1. rcs 命 

为 便于 说 明 ， 我 们 从 一 个 需要 管理 的 文件 的 初始 化 版 本 开始 介 
绍 。 在 本 例 中 ， 我 们 使 用 的 文件 为 important.c 它 实际 上 是 文件 foo.c 的 
一 份 副本 ， 但 在 文件 的 开头 加 上 了 如 下 的 注释 : 


r managing this project 
o World® progra 


第 一 个 任务 是 用 rcs 命 令 来 初始 化 该 文件 的 RCS 探 制 。 命 令 rcs-i 的 
作用 是 初始 化 RCS 控 制 文件 。 


$ rcs -i important.c 


NOTE This SN e log me ge 
This is an important demonstration file 


你 可 以 使 用 多 行 注释 ， 结 束 输入 需要 在 一 行 中 单独 使 用 一 个 更 文 
句号 (.) 或 输入 文件 结束 字符 (通常 是 组 合 键 Ctrl+D) 。 

执行 完 这 条 命令 后 ，rcs 将 创建 一 个 新 的 只 读 文 件 ， 该 文件 的 后 组 
a Av, AT P A: 


$s ls -1 


如 有 果 希 望 能 把 RCS 文 件 保存 到 为 一 个 目录 中 ， 你 只 和 需 在 第 一 
次 使 用 rcs 命 令 之 前 建立 一 个 名 为 RCS 的 子 目 录 ， 这 样 所 有 的 rcs 命 
令 都 会 目 动 地 把 RCS 文 件 保存 到 该 子 目录 中 。 


2.ci 命 令 
现在 可 以 使 用 ci 命令 将 源 文 件 的 当前 版 本 “ 签 入 ”(check in) 到 
RCS 中 了 : 


ci important.c 
sm rtant v Son 


如 果 先 前 乐 记 执行 rcs-i 命 令 了 ， 在 执行 ai 命 令 时 ，RCS 会 要 求 输入 
一 段 对 该 文件 的 描述 。 如 有 果 现 在 查看 目 孙 中 的 内 容 ， 你 将 会 发 现 文件 
important.c 已 被 删除 : 


$ 1s -1 


"portant 


» 文件 内 容 及 其 控制 信息 都 已 经 被 保存 到 RCS 文 件 important.c,v 中 


3. co 命令 

如 果 想 修改 文件 ， 你 必须 首先 “ 签 出 ”(checkout) 该 文件 。 如 果 只 
是 想 阅 读 该 文件 ， 你 可 以 用 co 命令 重建 当前 版 本 的 该 文件 并 将 它 的 权 
限 改 为 只 读 。 如 果 想 对 其 进行 修改 ， 你 就 必须 用 命令 co-1 锁 定 该 文 
件 ， 因 为 在 一 个 项 目 组 中 ， 必 须 确保 任 一 时 刻 只 有 一 个 人 可 以 修改 指 
定 的 文件 ， 这 也 是 指定 版 本 的 文件 只 能 有 一 份 副 本 拥有 写 权 限 的 原 
。 当 文件 以 可 写 方式 被 “等 出 "时 ， 对 应 的 RCS 文 件 将 被 锁定 。 


现在 有 了 可 以 进行 编辑 的 文件 ， 你 对 其 进行 修改 ， 把 新 版 本 存 
LM 令 保存 改动 。 现 在 文件 important.c 中 的 输出 部 分 代 
0 不 


dded later\n’ 


pU FSF cia 命令 : 


$ ci Sathana 


with single 


^» Added an extra line to be printed out. 


如 果 想 在 “ 签 入 ”该 文件 时 仍然 保留 文件 的 锁定 状态 ， 使 得 可 以 继 
续 对 该 文件 进行 修改 ， 你 就 需要 在 调用 ci 命令 时 加 上 -1 选项 。 这 样 ， 
在 “ 签 入 ”该 文件 的 同时 它 会 被 自动 “ 签 出 ”来 供 同一 用 户 使 用 。 

现在 ， 你 已 保存 了 该 文件 的 修订 版 本 。 如 果 查 看 目录 内 容 ， 你 就 
会 发 现 文 件 important.c 再 次 被 删除 了 : 


ls -1 


4. rlog 命 令 
查看 一 个 文件 的 改动 摘要 通常 是 很 有 用 的 。 你 可 以 用 rlog 命 令 来 
完成 这 一 功能 : 


5 rlog important.c 


输出 结果 中 的 第 一 部 分 给 出 了 对 该 文件 的 描述 以 及 rcs 使 用 的 选 
项 。 接 着 ，rlog 命 令 列 出 对 该 文件 的 修改 情况 和 你 “ 签 入 ”该 文件 时 输入 
的 注释 内 容 ， 最 近 的 修改 列 在 最 前 面 。 版 本 1.2 中 的 line:+1 -0 表明 在 这 
一 修订 版 本 中 增加 了 一 行 ， 示 删除 行 。 


注意 ， 文 件 修改 时 间 在 存储 时 不 会 进行 夏令 时 调整 ， 这 是 为 
了 避免 在 改变 时 钟 时 可 能 会 市 来 的 问题 


如 条 现在 想 取出 该 文件 的 第 一 个 版 本 ， 你 可 以 在 调用 co 命令 时 指 
定 需 要 的 版 本 号 ， 如 下 所 示 : 


co -r1.1 important.c 


ci 命令 也 有 一 个 -r 选 项 ， 它 的 作用 是 强制 指定 主 版 本 号 ， 例 如 命令 
ci -r2 important.c 将 把 文件 important.c“ 签 入 ”为 版 本 2.1。RCS 和 SCCS 默 
认 都 用 数字 1 作为 第 一 个 次 版 本 号 。 

5. rcsdiff 命 令 

如 果 只 是 想 了 解 两 个 版 本 之 间 的 区 别 ， 你 可 以 使 用 命令 rcsdiff: 


$ rcsdiff -r1.1 -r1.2 important.c 


ided terin* 


Se oe o 
6. PNA 

RCS 系 统 可 以 在 源 文件 中 使 用 一 些 特殊 的 字符 串 UE) 来 帮助 跟 
味 文 件 所 做 的 改动 >。 最 常用 的 两 个 宏 是 $RCSfile$ 4I $Id$ » HK 
$RCSfile$ 将 扩展 为 该 文件 的 名 字 ， 而 宏 $Id 将 扩展 为 一 个 标识 版 本 号 
的 字符 串 。RCS 系 统 文 持 的 特殊 字符 串 的 完整 列表 请 查看 在 线 帮助 手 
o 这些 安 将 在 文件 被 *“ 签 出 ?时 扩展 ， 并 且 在 文件 被 *“ 签 入 "时 目 动 更 
新 。 

下 面 我 们 对 文件 important.c 进 行 第 三 次 修改 ， 增 加 一 些 宏 : 


co ~ important.c 


修改 后 的 文件 如 下 所 示 : 


printfi*Helilo World n 
printf{"This is an extra line adde ate 
1 is under RCS contr 


现在 “ 签 入 ”该 版 本 ， 看 看 RCS 是 如 何 管 理 这 些 特殊 字符 串 的 : 


35 ci important.c 
NDOPLAME 


r log mess terminated with singie '.' or end of file 


enta sage, 
> Added $RCSfile$ and $Id$ strings 


WARE A BORA, DORADERASHRCSOCÓETERE: 


$ ls -1 
- r--r- important 


neil 


如 采 “ 签 出 ”( 使 用 co 命令 ) 该 文件 并 检查 该 源 文件 的 当前 版 本 ， 
你 束 会 发 现 宏 已 被 扩展 。 


$include <stdio.h> 


This is an important file for managing this project 
It implements the canonical "Hello Wcrid* program 
Filename: $RCSfile: important.c,v $ 


static char *RCSinfo = *$Id: important.c.v 1.3 2007/07/09 07:07:08 neil Exp $°; 


int main() ( 
printf(*Hello Worldin"!; 
printf(*This is an extra line added laterin*); 


printf('This file is under ACS control. Its ID in\nts\n", RCSinfol; 


exit (EXIT_SUCCESS) ; 


实 验 GNU make 和 RCS 
GNU 的 make 命 令 已 内 置 了 一 些 用 于 管理 RCS 文 件 的 规则 。 在 本 例 


中 ， 你 将 看 到 make 命 令 是 如 何 处 理 缺 少 源 文件 的 情况 的 。 


5 rm -f important.c 
$ make important 


实验 解析 

make 命 令 有 这 样 一 条 默认 规则 :， 当 make 制 作 的 目标 是 一 个 没有 后 
级 名 的 文件 时 ，make 将 编译 具有 同样 的 名 字 但 加 上 .c 后 级 名 的 源 文 
件 。make 命 令 具 有 的 第 二 条 默认 规则 允许 make 命 令 通 过 RCS 系 统 从 文 
件 important.cv 创 建 出 文件 important.c。 在 这 个 例子 中 ， 由 于 文件 


important.c 不 存在 ，make 命 令 束 用 co 命令 “ 签 出 ”该 文件 的 最 新 版 本 。 
编译 完成 后 ， 它 还 会 删除 文件 important.c 来 清理 目 孙 。 


7. ident 命 令 

你 可 以 用 ident 命 令 查找 包含 $Id$ 字 人 符 串 的 文件 的 版 本 。 因 为 你 将 
字符 串 保 存 到 一 个 变量 中 ， 所 以 它 也 会 出 现在 最 终 的 可 执行 程序 中 。 
你 可 能 会 发 现 ， 如 采 在 源 代 码 中 加 入 一 些 特殊 字符 串 ， 但 未 使 用 它 
们 ， 一 些 编译 器 束 会 出 于 优化 的 目的 将 其 删除 。 为 解决 这 个 问题 ， 你 
可 以 在 代码 中 增加 一 些 对 这 些 字 符 串 的 “ 假 ? 访 问 ， 但 随 着 编译 器 越 来 
越 好 ， 解 决 这 个 问题 也 会 变 得 越 来 越 困 难 ! 

下 面 这 个 人 简单 的 例子 将 显示 ， 你 如 何 使 用 ident 命 令 来 验证 用 于 建 
六 一 个 可 执行 文件 的 源 文件 的 RCS 版 本 。 


实 验 ident 命 令 


./important 


$ ident important 


Am 


实验 解析 

通过 执行 程序 ， 你 看 到 字符 串 确 实 已 合并 到 可 执行 文件 中 。 接 
着 ， 你 用 ident 命 令 从 可 执行 文件 里 提取 出 $Id$ 字 符 串 。 

使 用 RCS 系 统 及 出 现在 可 执行 文件 中 的 $Id$ 字 符 串 的 技巧 可 以 成 
为 一 个 功能 非常 强大 的 工具 ， 它 有 助 于 确定 客户 报告 有 问题 的 文件 的 
版 本 。 你 还 可 以 将 RCS (或 SCCS) 作为 项 目 跟踪 工具 的 一 部 分 ， 用 它 
来 跟踪 报告 的 问题 及 其 解决 方法 。 如 果 你 做 的 是 软件 销售 工作 ， 或 者 
哪怕 是 赠送 软件 ， 了 解 不 同 版 本 之 间 的 改动 情况 也 是 非常 重要 的 。 

如 果 还 想 了 解 有 关 RCS 的 更 多 信息 ， 除 标准 的 RCS 手 册页 以 外 ， 
使 用 手册 中 的 rcsintro 页 面 给 出 了 完整 的 RCS 系 统 介 绍 。ci、co 等 命令 
也 有 其 各 自 的 手册 页 。 


9.3.2 SCCS 


SCCS 提 供 了 与 RCS 非 常 类 似 的 功能 。SCCS 的 优势 在 于 ， 它 得 到 
了 X/Open 规范 的 定义 ， 因 此 所 有 正规 的 UNIX 系 统 都 应 该 支持 它 。 但 


较 现 实 的 情况 是 ，RCS 的 可 移植 性 非常 好 ， 并 且 可 以 自由 发 布 。 所 
以 ， 如 果 你 有 一 个 类 UNIX 系 统 ， 不 管 它 是 否 遵 循 X/Open 规 范 ， 你 都 
可 以 在 其 上 获取 并 安装 RCS。 因 此 ， 我 们 不 准备 对 SCCS 做 进一步 的 介 
绍 ， 而 只 对 这 两 个 系统 各 自 使 用 的 命令 进行 简单 的 比较 ， 以 方便 那些 
准备 在 这 两 个 系统 之 间 进 行 切 换 的 用 户 。 


9.3.5 ”RCS 和 SCCS 的 比较 


直接 比较 这 两 个 系统 所 提供 的 命令 是 很 困难 的 ， 所 以 表 9-2 只 能 被 
看 作 是 一 个 简单 的 起 点 。 这 里 列 出 的 两 个 系统 的 命令 在 完成 同一 项 任 
务 时 并 不 使 用 相同 的 选项 ， 如 果 不 得 不 使 用 SCCS 系 统 ， 你 束 必 须 目 己 
查找 合适 的 选项 ， | à 
9-2 


RCS SCCS 


除 上 面 列 出 的 那些 命令 外 ，SCCS 系 统 中 的 sccs 命 令 在 功能 上 与 
RCS 系 统 中 的 rcs 和 co 命令 有 些 相 交 。 例 如 ， 命 令 sccs edit 和 sccs create 
就 分 别 相 当 于 命令 co -1 和 rcs -i ° 


9.3.4 CVS 


除 使 用 RCS 系 统 外 ， 管 理 文件 改动 的 另外 一 种 方法 是 使 用 CVS 系 
统 ， 即 并 发 版 本 控制 系统 。CVS 系 统 现在 变 得 非常 流行 ， 可 能 是 因为 
与 RCS 系 统 相 比 ， 它 有 一 个 明显 的 优势 : 人 们 可 以 通过 互联 网 使 用 
CVS 系 统 ， 而 不 像 RCS 系 统 只 能 用 在 一 个 共享 的 本 地 目 孙 中。CVS 还 
支持 并 行 开发 ， 即 许多 程序 员 可 以 在 同一 时 间 修 改 同一 个 文件 ， 而 
RCS 在 任 一 时 间 只 允许 一 个 用 户 修改 一 个 特定 文件 。CVS 的 命令 与 
RCS 的 类 似 ， 这 是 因为 CVS 最 初 是 作为 RCS 的 一 个 前 端 程序 来 开发 


的 

由 于 CVS 系 统 能 够 以 灵活 的 方式 路 网 络 运行 ， 所 以 它 适 用 于 软件 
开发 者 之 间 唯 一 的 网 络 连接 方式 就 是 通过 互联 网 这 种 情况 。 许 多 Linux 
和 GNU 项 目 就 是 通过 CVS 系 统 来 帮助 不 同 的 开发 者 协同 工作 的 。 一 般 
n 通过 CVS 系 统 对 远 端 文件 进行 操作 与 通过 它 处 理 本 地 文件 并 无 
X HI| o 


在 本 章 中 ， 我 们 将 简要 地 介绍 CVS 的 基础 知识 ， 通 过 学 习 ， 你 可 
以 开始 使 用 本 地 版 本 库 ， 并 知道 如 何 通过 互联 网 ， 从 CVS 服 务 器 上 获 
取 项 目的 最 新 源 文件 副本 。 有 关 CVS 的 更 详细 信息 请 参考 由 Per 
Cederqvist 等 撰写 的 CVS 使 用 手册 ， 该 手册 位 于 网 址 
http://ximbiot.com/cvs/manual/, 你 还 可 以 在 该 网 址 上 找到 FAQ 文 件 和 其 
他 一 些 有 帮助 的 文件 。 

首先 ， 你 需要 创建 一 个 版 本 库 ，CVS 系 统 将 其 控制 文件 和 它 管 理 
的 文件 的 主 副 本 保存 在 这 个 版 本 库 中 。 版 本 库 的 结构 是 树 状 的 ， 所 以 
你 不 仅 可 以 把 一 个 项 目的 完整 目录 结构 保存 在 一 个 版 本 库 中 ， 还 可 以 
在 同一 个 版 本 库 中 保存 多 个 项 目 。 当 然 ， 你 也 可 以 将 彼此 没有 关联 的 
项 目 分 别 保存 到 不 同 的 版 本 库 中 。 你 将 在 后 面 看 到 如 何 告诉 CVS 系 统 
你 要 使 用 哪 一 个 版 本 库 。 

1. CVS 的 本 地 使 用 

我 们 首先 创建 一 个 版 本 库 。 为 保持 人 简单， 这 将 是 一 个 本 地 版 本 
库 ， 并 且 因 为 你 将 只 使 用 这 一 个 版 本 库 ， 所 以 适宜 将 其 放 到 /usr/local 
目录 下 。 在 大 多 数 的 Linux 发 行 版 中 ， 所 有 的 普通 用 户 都 属于 组 users, 
所 以 将 该 版 本 库 的 属 组 也 设 为 users, 这 样 所 有 用 户 都 可 以 访问 它 了 。 

以 超级 用 户 的 身份 为 版 本 库 创建 目录 : 


* chgrp users /usr/local/repository 
* chmod g*w /usr/local/repository 


切换 为 普通 用 户 ， 将 该 目录 初始 化 为 一 个 CVS 版 本 库 。 如 采 你 不 
属于 users 组 ， 那 么 需要 拥有 目录 /usr/local/repository 的 写 权 限 ， 才 能 执 
行 这 一 操作 。 

$ cvs -d /usr/local/repository init 


-d 选 项 告诉 CVS 你 希望 版 本 库 创建 在 哪个 目 孙 中 。 

现在 版 本 库 已 创建 好 ， 你 可 以 将 项 目的 初始 版 本 保存 到 CVS 中 
了 。 做 这 项 工作 时 ， 你 可 以 利用 一 个 小 技巧 来 世 省 一 些 打 字 的 时 间 。 
所 有 的 cvs 命 令 在 查找 CVS 目 录 时 都 可 以 使 用 两 种 方法 ， 一 是 在 命令 行 
中 使 用 -d<path> 选 项 〈 束 像 你 刚才 使 用 init 命 令 时 那样 ) ;如果 未 使 用 - 
d 选 项 ，cvs 命 令 束 会 去 得 看 环境 变量 CVSROOT 的 值 。 你 不 想 在 每 次 执 
行 cvs 命 令 时 都 加 上 -d 选 项 ， 所 以 你 将 用 第 二 种 方法 设置 环境 变量 
CVSROOT ° 如 果 使 用 的 shell 是 bash, 则 设置 环境 变量 的 方法 如 下 所 
ZN: 


$ export CVSROOT=/usr/local/repository 


首先 ， 切换 到 项 目 所 在 的 目录 ， 然 后 告诉 CVS 导 入 该 日 好 下 的 所 
有 文件 。 对 CVS 系 统 而 言 ， 一 个 项 目 就 是 相关 文件 和 目录 的 集合 
股 来 说， 它 包 括 用 于 创建 应 用 程序 所 需 的 所 有 文件 。 术 语 导 入 的 含义 
将 文件 置 于 CVS 的 控制 之 下 ， 并 将 它们 复制 到 CVS 版 本 库 中 。 对 
^ IRE 你 有 一 个 名 为 cvs-sp (BICVS simple project 的 缩写 ) AYE 
孙 ， 它 包含 两 个 文件 : hello.c 和 Makefile: 


; cd cvs-sp 
s -l 


CVS 导 入 命令 是 cvs import, € 它 的 使 用 


5 eve import -m"Initial version of Simple Project" wrox/chap9-cvs wrox start 


上 面 这 条 命令 告诉 CVS 导 入 当前 目录 (cvs-sp) 下 的 所 有 文件 ， 同 
时 为 其 加 上 一 条 日 志 信 息 。 

参数 wrox/chap9-cvs 告 诉 CVS 保 存 新 项 目的 位 置 ， 这 里 给 出 的 是 相 
对 于 CVS 树 根 的 路 径 。 请 记 住 ， 只 要 你 愿意 ，CVS 可 以 在 同一 个 版 本 
库 中 保存 多 个 项 目 。 选 项 wrox 相 当 于 厂商 标签 ， 它 用 于 标识 导入 文件 
的 初始 版 本 的 提供 者 。 选 项 start 是 一 个 版 本 标签 ， 它 用 于 标识 一 组 相 
关 的 文件 ， 例 如 构成 一 个 软件 特定 版 本 的 一 组 文件 。CVS 对 上 面 命令 
的 啊 应 如 下 所 示 : 
输出 结果 表明 它 成 功 地 导入 了 两 个 文件 。 

现在 是 查看 能 人 否 从 CVS 系 统 中 获取 文件 的 好 时 机 。 你 可 以 先 建 立 
一 个 junk 目 录 ， 然 后 导出 文件 以 确认 一 切 工 作 正常 。 


mkdir junk 
cå junk 
vs checkout wrox/chap9-cvs 
U CÓ 
U wrox/chap9-cvs/hello. 


你 加 CVS 给 出 与 导入 文件 时 相同 的 路 径 。CVS 在 当前 目录 中 创建 
wrox/chap9- e 目录 ， 然 后 将 文件 放 到 该 子 目录 中 。 

现在 开始 对 项 目 做 一 些 改动 。 编 辑 目 了 永 wrox/chap9-cvs 中 的 文件 
hello.c, ad Ef midi des 在 该 文件 中 添加 下 面 一 行内 容 : 


p: 


然后 重新 编译 并 运行 程序 以 保证 一 切 顺 利 。 


你 可 以 询问 CVS 这 个 项 目 有 哪些 改动 。 你 并 不 需要 告诉 CVS 你 关 
心 的 文件 具体 是 哪个 ， 它 能 够 一 次 性 完成 对 整个 目录 的 检查 : 


$ cvs diff 
CVS 啊 应 如 下 : 


你 对 自己 做 的 改动 很 满意 ， 所 以 决定 将 其 提交 给 CVS。 

当 把 改动 提交 给 CVS 时 ， 它 会 启动 一 个 编辑 器 让 你 输入 一 条 日 志 
信息 。 你 可 以 在 运行 commit 命 令 之 前 ， 通 过 设置 环境 变量 
CVSEDITOR 来 强制 使 用 一 个 特定 的 编辑 絮 。 


$ cvs commit 
CVS 的 啊 应 表明 它 正 在 导入 的 内 容 : 


g 1 ry/wrox/chnapS-cvs/heilo.c.: 
new revision 2; previous revision 


现在 可 以 询问 CVS, 这 个 项 目 目 第 一 次 导入 后 的 改动 情况 。 你 询问 
目 wrox/chap9-cvs 自 版 本 1.1 〈 即 初始 化 版 本 ) 以 来 的 所 有 改动 
情况 。 

$ cvs rdiff -r1.1 wrox/chap9-cvs 

CVS 给 出 的 结果 如 下 : 


Non 
2 €. 


假设 在 CVS 系 统 之 外 的 本 地 目录 中 还 有 一 份 代码 的 副本 ， 现 在 你 
想 刷 狐 该 目录 中 的 文件 以 更 新 那些 你 没有 修改 过 、 但 已 被 其 他 人 改动 
过 的 文件 。CVS 的 update 命 令 可 以 帮助 你 完成 这 一 工作 。 首 先 移动 到 
人 

JAT: 


S cvs update -Pd wrox/chap9-cvs 


CVS 开 始 刷 新 相关 文件 ， 它 把 其 他 人 修改 过 而 你 未 动 过 的 文件 从 
版 本 库 中 提取 出 来 ， 并 放 到 你 的 本 地 目 未 中。 当然， 其 中 一 些 修改 可 
能 与 你 做 的 修改 有 冲突 ， 但 这 是 需要 你 解决 的 问题 ， CVS 是 好 东西 ， 
但 它 并 不 是 无 所 不 能 ! 

至 此 ， 你 应 该 可 以 看 出 ，CVS 的 用 法 与 RCS 相 当 接 近 。 但 它们 之 
间 其 实 有 一 个 我 们 还 未 提 及 的 十 分 重要 的 区 别 ， 那 承 是 CVS 具 备 在 不 
事先 挂 载 文件 系统 的 情况 下 路 网 络 操作 的 能 力 。 

2. 路 网 络 访问 CVS 

前 面 已 经 介绍 过 ， 你 可 以 通过 为 每 个 命令 加 上 -d 选 项 或 设置 环境 
变量 CVSROOT 来 告诉 CVS 版 本 库 所 在 的 位 置 。 如 果 想 跨 网 络 操作 ， 
你 只 需要 使 用 这 个 参数 的 一 个 更 高 级 的 语法 即 可 。 例 如 ， 在 写作 本 书 
的 时 候 ，GNOME (GNU 网 络 对 象 模 型 环境 ， 一 个 流行 的 开源 图 形 桌 
面 系统 ) 的 开发 源 代 码 都 是 通过 CVS 系 统 在 因特网 上 访问 的 。 你 只 需 
人 
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作为 另外 一 个 例子 ， 你 可 以 通过 设置 环境 变量 CVSROOT 为 : 
pserver: anonymous@dev.w3.org: /sources/public, Ff CVS ## F] Web in iE 
组 织 W3C 的 CVS 版 本 库 。 这 个 设置 告诉 CVS, 该 版 本 库 使 用 密码 验证 
(pserver) , 且 位 于 服务 器 devw3.org 上 ° 

在 访问 源 代 码 之 前 ， 你 需要 先 登 录 ， 如 下 所 示 : 


export CVSROOT»:pserver:anonymousGdev.w3.0rg:/sources/public 
; cva login 


在 提示 输入 密码 时 输入 anonymous ° 

现在 可 以 使 用 cvs 命 令 了 ， 命 令 的 用 法 和 你 对 本 地 版 本 库 进 行 操 作 
时 一 样 ， 只 有 一 个 小 区 别 : 需要 给 每 个 cvs 命 令 加 上 -z3 选 项 以 强制 执 
行 数 据 压 缩 ， 这 可 以 节约 网 络 市 宽 。 

假设 想 要 获取 W3C HTML 验 证 程序 的 源 代码 ， 使 用 的 命令 是 : 


S evs -z3 checkout validator 


Jn RARE, BI CARRERE RI EBB SERIES UR], OR EE A 
CIHLA EJREICVSHRAS » AMEZ n] DB xt xinetdgXinetd?E 5E E, E 
(AS fs FH ERU T IRI Linux AZ Boo xinetd Vi, (Kis Se 
辑 文件 /etc/xinetd.d/cvs 来 反映 CVS 版 本 库 的 位 置 ， 并 使 用 系统 配置 工具 
来 激活 和 启动 cvs 服 务 。 对 inetd 玉 说 ， 你 只 需 在 文件 /etc/inetd.conf 中 添 
加 如 下 一 行 语句 ， 然 后 重启 inetd 即 可 。 


这 条 语句 告诉 inetd 进 程 为 连接 到 本 机 2401 端 口 的 客户 自动 启动 一 
个 CVS 会 话 ， 端 口 2401 是 标准 的 CVS 服 务 器 监听 端口 。 有 关 如 何 通过 
inetd 局 动 网 络 服务 的 更 详细 资料 请 参考 inetd 和 inetd.conf 的 手册 页 。 

如 果 想 通过 网 络 访问 的 方式 使 用 CVS 版 本 库 ， 你 必须 正确 地 设置 
环境 变量 CVSROOT。 例 如 : 
* export CVSROOT=:pserver:neil@localhost:/usr/local/repository 

目前 为 止 ， 我 们 仅 简 单 介 绍 了 CVS 的 功能 。 如 果 想 用 好 CVS 系 
统 ， 我 们 强烈 建议 你 设置 一 个 本 地 版 本 库 来 进行 练习 ， 并 获取 更 全 面 
的 CVS 文 档 。 请 记 住 ，CVS 的 源 代码 是 开放 的 ， 如 果 搞 不 懂 代 码 的 作 
用 和 目的 ， 或 者 (虽然 不 太 可 能 ， 但 确实 有 可 能 ! ) 认为 自己 发 现 了 
一 个 bug， 你 总 是 可 以 获取 源 代码 并 上 自己 进行 分 析 。CVS 的 主页 是 


http://ximbiot.com/cvs/cvshome/ ° 


9.3.5 CVSH) Hare 


许多 图 形 前 端 程序 可 用 于 访问 CVS 版 本 库 。 网 址 
http:/www.wincvs.org 提 供 了 可 能 是 最 好 的 多 操作 系统 前 端 程序 集合 。 
该 网 址 上 有 用 于 Windows、Macintosh、Linux 系 统 的 客户 端 程序 。 

CVS 前 端 程序 通 销 都 允许 创建 和 管理 版 本 库 ， 包 括 远 程 访问 基于 
网 络 的 版 本 库 。 


图 9-1 显 示 了 我 们 的 简单 应 用 程序 的 开发 历史 ， 这 是 在 一 个 
Windows 网 络 客户 端 上 使 用 WinCVS 前 端 程序 显示 的 。 


nmt */;* SMBRRAaR LE as 20 
a (Cn Oe 一 站 T - = Temata 3 


Lm 
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9.3.6 Subversion 


Subversion 旨 在 成 为 开源 社区 中 用 于 强制 替换 CVS 的 版 本 控制 系 
统 。 根 据 Subversion 主 页 http://subversion.tigris.org 上 的 说 法 ， 它 被 设计 
为 一 个 “更 好 的 CVS”。 因 此 ， 它 具有 CVS 的 大 多 数 功 能 ， 并 有 旦 其 接口 
的 工作 方式 也 与 CVS 类 似 。 

Subversion 正 变 得 日 益 普 及 ， 尤 其 对 于 社区 开发 的 项 目 更 是 如 此 。 
因为 在 这 些 项 目 中 ， 开 发 人 员 都 是 通过 因特网 来 共同 开发 一 个 应 用 程 
序 。 大 多 数 Subversion 用 户 都 是 连接 到 一 个 由 开发 项 目的 管理 员 建 立 的 
基于 网 络 的 版 本 库 。 个 人 或 小 团队 的 项 目 使 用 Subversion 的 并 不 多 ， 
CVS 仍 然 是 他 们 的 首选 工具 。 

表 9-3 比 较 了 CVS 和 Subversion 中 一 些 完成 同样 功能 的 命令 。 

9-3 


有 关 Subversion 的 完整 文档 见 网 址 http://synbook.red-bean, com 上 的 
在 线 书 籍 Version Control with Subversion (使 用 Subversion 进 行 版 本 控 
制 ) e 


9.4 = 


如 末 正 在 编写 一 个 新 命令 作为 整个 开发 任务 的 一 部 分 ， 你 应 该 为 
其 创建 手册 页 。 你 可 能 已 注意 到 ， 大 多 数 手册 页 的 排版 格式 都 很 相 
似 ， a 分 组 成 : 

Header (标题 ) 
Name (和 名称) 
Synopsis (语法 格式 ) 
Description (说 明 ) 
Options (选项 ) 
Files (相关 文件 )” 
See also (其 他 参考 ) 
Bugs (已 知 漏洞 ) 

你 可 以 竹 让 册页 中 省 去 无 关 部 分 。Linux 的 手册 页 还 经 常会 在 结尾 
出 现 一 个 Author (开发 者 ) 部 分 。 

UNIX 的 手册 页 是 通过 工具 nroff 排 版 的 ， 在 大 多 数 Linux 系 统 
用 于 完成 相同 功能 的 工具 为 groff， 它 是 由 GNU 项 目 开 发 的 。 。 这 两 个 工 
具 都 是 在 早期 的 排版 工具 roff 或 run-off 的 基础 上 开发 的 。nroff 或 groff 命 
令 的 输入 都 是 纯 文本 ， 只 是 乍 看 起 来 ， 它 们 的 语法 都 显得 非常 星 湿 难 
懂 。 但 无 需 紧 张 ， 在 UNIX 编 程 中 编写 新 程序 的 一 种 最 简单 的 方法 就 
苹 以 现 有 的 程序 作为 起 点 ， 并 对 其 进行 修改 ， 编写 手册 页 也 起 一 样 。 

对 groff (或 nroff) 命令 所 使 用 的 各 种 选项 、 命 令 和 宏 进 行 详细 说 
明 超 出 了 本 书 讨论 的 范围 。 我 们 在 这 里 只 提供 一 个 简单 的 模板 ， 读 者 
可 以 借鉴 并 写 出 目 己 的 手册 页 。 

下 面 是 一 个 用 于 myapp 应 用 程序 的 简单 的 手册 页 的 源 代码 ， 它 位 
于 文件 myapp.1 中 : 


SH SYNOPSIS 
B myapp 
Y-option 


口 口 口 口 口 口 口 口 


PP 
tinmyapp\fP is a complete application that does nothing useful 


BH OPTION 
It doean't have any, but let's pretend, to make this template complete: 
T? 
-BY option 
If are: was an option, it would not be -option. 
SH RES CES 


pe 
myapp uses almost no resources 

.SH DIAGNOSTICS 

The program shouldn't output anything, so if you find it doing so there's 
pem bably somec eins wrong, The return value is zero. 

H SEB ALSO 

The only other program we know with thin little functionality is the 
ubiquitous hello world application 

.SM COPYRIGHT 
myapp is Copyright (c) 2007 Wiley Publishing, Inc. 

This program is free software; you can redistribute it and/or modify 
it under the terms of the GNU General Public License as published by 
the Free Software Foundation; either version 2 of the License, or 
(at your option) any later version. 

This program is distributed in the hope that it will be useful. 

but Wi THOUT ANY WARRANTY; without even the implied warranty of 
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the 

GNU General Public License for more details, 

Vou should have received a copy of the GNU General Public License 
along with this program; if not, write to the Free Software 
foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 021111307 USA. 
SH BUGS 
There probably are some, but we don't know what they are yet. 

.SH AUTHORS 
Neil Matthew and Rick Stones 


正如 你 所 看 到 的 ， UM 行 开 头 的 小 数 点 (.) SIA, JEH 
De HABET 。 第 一 行 结尾 的 数字 [表示 这 个 人 命令 出 现在 手册 页 的 哪 
个 部 分 。 因 为 命令 AN TATE NA ， 所 以 这 里 就 是 我 们 放置 
源 应 用 程序 说 明 的 位 置 。 

你 可 以 通过 修改 这 个 样本 或 参考 其 他 命令 的 手册 页 源 代码 来 生成 
自己 的 手册 页 。 你 可 能 还 需要 看 一 下 Linux 的 手册 页 mini-HowTo， 它 
由 Jens Schweikhardt 编 写 ， 并 作为 Linux 文 档 项 目的 一 部 分 收 录 在 
http://www.tldp.org/ 中 。 

现在 已 经 有 了 手册 页 的 源 代 码 ， 你 可 以 用 groff 命 令 来 处 理 它 。 
groff 命 令 通 常 产 生 ASCIIX 本 (-Tascii) 或 PostScript (-Tps) 。 你 可 以 
ere 命令 生成 手册 页 ， 这 会 让 groff 加 载 专用 的 手册 
TAFE X: 


$ groff -Tascii -man myapp.1 
它 给 出 如 下 的 输出 结 采 : 


MYAPS (LT) MYAPP (1 


SYNOPSIS 


BUGS 


AUTHORS 


现在 你 已 测试 了 手册 页 ， 下 一 步 束 需要 安装 它 。 显 示 手 册页 的 
man 命 令 通 过 环境 变量 MANPATH 来 搜索 手册 页 。 你 可 以 将 新 的 手册 页 
放置 到 一 个 本 地 手册 页 目 孙 中 ， 或 者 将 其 直接 放 到 系统 
3K/usr/man/man1 HH ° 

当 用 户 第 一 次 要 求 阅 读 这 个 手册 页 时 ，man 命 令 将 目 动 对 其 进行 
排版 并 显示 排版 结果 。 有 些 版 本 的 man 命 令 还 可 以 上 自动 生成 并 保存 一 
份 预 排版 (还 有 可 能 经 过 压缩 ) 的 ASCII 文 本 版 本 的 手册 页 ， 来 加 速 
对 同一 页 面 的 后 续 访 问 请 求 的 处 理 。 


^ 


9.5 


发 行 软件 面临 的 最 主要 问题 是 ， 如 何 确 保 已 包含 所 有 必要 的 文件 
并 且 它 们 都 属于 正确 的 版 本 。 笠 和 运 的 是 ， 因 特 网 编程 社区 已 形成 了 一 
套 健壮 的 方法 ， 非 常 有 助 于 解决 这 些 问 题 ， 这 些 方法 包括 以 下 儿 个 。 

口 利用 所 有 UNIX 系 统 都 有 的 标准 工具 将 软件 所 需 的 所 有 文件 打 

包 为 一 个 单独 的 软件 包 文件 。 

O 控制 软件 包 的 版 本 编号 。 

O 建立 文件 命名 规范 ， 在 软件 包 文件 的 名 字 中 包含 版 本 号 ， 从 

而 方便 用 户 辨认 他 们 所 使 用 的 软件 的 版 本 。 

O 在 软件 包 中 使 用 子 目 孙 ， 以 确 傈 从 软件 包 中 提取 的 文件 都 被 

en 


这 些 方法 的 产生 意味 着 软件 的 发 行 工作 能 够 轻松 、 可 靠 地 完成 。 
但 软件 的 安装 是 否 容易 则 是 另外 一 回 事 ， 因 为 这 与 软件 本 身 以 及 准备 
安装 它 的 计算 机 系统 有 关 。 但 至 少 你 可 以 确保 软件 包 中 的 所 有 文件 各 
are 


9.5.1 _patch 程 序 


软件 发 行 以 后 ， 用 户 发 现 软件 的 漏洞 或 开发 者 硕 望 增强 或 升级 软 
件 的 情况 几乎 是 不 可 避免 的 。 如 果 开 发 者 以 二 进 制 文件 的 形式 发 行 软 
件 ， 他 们 通常 只 会 发 行 新 的 二 进 制 文件 。 有 时 〈 经 常 是 这 样 ) . ] PH 
Bc 0 009 quantas Ma ee Go. 
一 笔 市 过 。 

男 一 方面 ， 以 源 代码 的 形式 来 发 行 软件 是 个 好 主意 ， 因 为 它 允 许 
用 户 了 解 你 是 如 何 实现 该 软件 以 及 如 何 运 用 一 些 功 能 的 。 它 还 可 以 让 
用 户 检查 程序 在 做 什么 ， 并 且 人 允许 用 户 重用 软件 的 部 分 源 代 码 (前 提 
是 他 们 遵守 相关 的 许可 证 协议 ) 。 

但 是 ， 对 于 Linux 内 核 的 源 代码 来 说 ， 它 在 压缩 之 后 仍然 有 数 十 兆 
之 多 ， 包 装 并 传送 一 套 新 版 本 的 内 核 源 代码 将 消耗 大 量 的 资源 ， 而 事 
实 上 ， 各 版 本 之 间 可 能 只 有 很 少 一 部 分 的 源 代码 发 生 了 改动 。 

焉 运 的 是 ， 我 们 有 一 个 解决 这 一 问题 的 工具 程序 一 patch， 它 由 
Larry Wall 编 写 ， 他 也 是 Perl 编 程 语言 的 开发 者 。patch 命 令 允 许 软 件 的 
开发 者 只 发 行 定 义 两 个 版 本 之 间 区 别 的 文件 ， 这 样 无 论 是 谁 ， 只 要 他 


拥有 某 个 文件 的 第 一 个 版 本 和 第 一 个 版 本 与 第 二 个 版 本 之 间 的 区 别 文 
件 ， 他 整 可 以 用 patch 命 令 来 目 己 生成 该 文件 的 第 二 个 版 本 。 
如 采 你 有 一 个 如 下 文件 的 第 一 个 版 本 : 


qiie no line 4, tbis is line 5 
它 的 第 二 个 版 本 如 下 所 示 : 
This is file two 
line 4 


line € 
a new line B 


你 可 以 使 用 diff 命 令 列 出 两 个 版 本 之 间 的 不 同 之 处 : 
9 diff filel.c file2.c > diffs 
diffs 文 件 的 内 容 如 下 所 示 : 


ici 
* This is file one 


This 
4cé, 5 

ther t 4, thi l 

ii 4 

lin 
5a7 
> a new line 8 

这 实际 上 是 一 组 编辑 器 命令 ， 它 们 用 于 将 一 个 文件 修改 为 另 一 个 


文件 。 假 设 你 已 经 有 了 文件 外 el.c 和 diffs， 就 可 以 用 patch 命 令 来 更 新 文 
ffilel.c, AU Fr: 


$ patch filei.c diffs 
Hin Looks like a normal diff to me.. 
sing Plan A 


Patching file filel. 
nk succeeded at 1 
#2 succeeded at 4 
dunk 83 succeeded at 7, 


patch 命 令 将 文件 flel.c 修 改 为 与 fe2.c 一 模 一 样 。 

patch 命 令 还 有 男 一 个 技巧 :取消 补丁 的 能 力 。 假 设 你 不 喜欢 刚才 
的 修改 ， 想 将 flel.c 恢 复 为 原来 的 样子 。 没 问题 ， 你 只 需 再 次 使 用 
patch 命 令 ， 不 过 这 一 次 要 使 用 -R 〈 反 向 补丁 ) 选项 : 


5 patch -R filel.c diffs 
Hm Looks like a normal diff 


文件 filel.c 将 回 到 它 最 初 的 样子 。 

patch 命 令 还 有 其 他 几 个 选项 ， 但 一 般 情 况 下 它 会 根据 输入 的 内 容 
来 判断 用 户 想 做 什么 ， 然 后 执行 正确 的 操作 。 如 采 patch 命 令 执 行 失 
败 ， 它 会 创建 一 个 后 组 名 为 .rej 的 文件 ， 在 该 文件 中 将 包含 无 法 打上 补 
丁 的 文件 内 容 。 

在 处 理 软件 的 补丁 时 ， 使 用 diff 命 令 的 -c 选 项 是 个 好 办 法 。 这 个 选 
项 的 作用 是 产生 一 个 基于 上 下 文 的 diff， 即 提供 每 处 修改 的 前 后 几 行 内 
容 ， 这 样 patch 命 令 可 以 在 打 补 丁 之 前 验证 上 下 文 是 否 匹 配 ， 而 补丁 文 
件 本 喘 也 更 容易 阅读 。 


如 果 你 在 某 个 程序 中 发 现 了 漏洞 并 进行 了 修补 ， 给 程序 的 开 
eee ` 更 准确 ， 
不 o 


9.5.2 47 1. 


Linux 的 程序 和 源 代 码 通常 以 打包 压缩 文件 的 格式 发 行 ， 在 文件 名 
中 包含 软件 的 版 本 号 ， 文 件 的 后 缀 名 为 .tar.gz 或 .tgz， 这 类 文件 通常 也 
被 称 为 tarballs 文 件 。 如 果 使 用 的 是 普通 的 tar 命 令 ， 则 创建 tarballs 文 件 
y P m -o 下 面 的 命令 将 为 应 用 程序 创建 一 个 打包 压缩 文 


5 tar cvf myapp-1.0.tar main.c 2.c 3.c *.h myapp.1 Makefile5 
1205 


你 现在 有 了 一 个 TAR 文件 ， 如 下 所 示 : 


$ 1s -1 *.tar 


你 可 以 用 压缩 程序 gzip 对 该 文件 进行 压缩 ， 使 得 其 容量 更 小 : 


> gzip myapp-1.0.tar 
$ 1s -1 *.gz 


| 正如 你 所 看 到 的 ， 最 终 的 文件 容量 被 压缩 的 非常 小 。 你 还 可 以 把 
文件 的 后 缀 名 .tar.gz 改 为 更 简单 的 .tgz， 如 下 所 示 : 


$ mv myapp-1.0.tar.gz myapp_vl.tgz 


这 种 以 一 个 小 数 点 和 3 个 字符 结尾 的 文件 命名 方式 看 上 去 像 是 针对 
Windows 系 统 的 一 种 妥协 ， 因 为 Windows 系 统 不 同 于 Linux 和 UNIX 系 
统 ， 它 对 文件 后 缀 名 正确 与 否 的 依赖 性 非常 强 。 要 想 再 取 回 文件 ， 你 
需要 先 解压 缩 tar 文 件 ， 再 解 包 ， 从 而 将 文件 释放 出 来 ， 如 下 所 示 : 


5 mv myapp vl.tgz myapp-1.0.tar.gz 
$ gzip -d myapp-1.0.tar.gz 

$ tar xvf myapp-1.0.tar 

main > 


”如 果 使 用 的 是 GNU 版 本 的 tar 命 令 ， 情 况 将 变 得 更 简单 ， 你 仅 用 一 
步 就 可 以 创建 打 和 外 压缩 文件 ， 如 下 所 示 ， 


; tar zcvf myapp_vl.tgz main.c 2.c 3.c *.h myapp.1 Makefile5 
nair 


EE, HEHSTBPRTEQLRIS ER, AU RB: 


$ tar zxvf myapp vi.tgz 


如 果 想 在 没有 真正 解压 缩 文 件 的 情况 下 了 解 打 包 压 缩 文 件 的 内 
， 你 可 以 使 用 tar 命 令 的 另 一 个 选项 ztvf 。 


Dm 


我 们 在 上 面 的 例子 中 使 用 了 tar 命 令 ， 但 对 其 选项 的 描述 仅 限 于 例 
子 中 使 用 的 那些 选项 。 下 面 我 们 将 对 该 命令 及 其 常用 选项 做 简单 的 说 
明 。 正 如 你 在 上 面 的 例子 中 所 见 ，tar 命 令 的 基本 语法 是 : 


tar [options] [list of files] 


列表 中 的 第 一 项 是 目标 ， 虽 然 我 们 一 直 处 理 的 都 是 文件 ， 但 它 也 
可 以 是 一 个 设备 。 列 表 中 的 其 他 项 将 根据 选项 的 情况 被 添加 到 新 档案 
文件 或 已 有 档案 文件 中 。 列 表 中 还 可 以 包含 目录 ， 默 认 情 况 下 ， 该 目 
录 中 的 所 有 子 目 录 都 将 被 包含 到 档案 文件 中 。 释 放 文 件 并 不 需要 给 
文件 的 名 字 ， 因 为 ta 命令 将 保留 文件 的 完整 路 径 。 

在 本 下 中 ， 我 们 使 用 了 tar 命 令 的 如 下 6 个 选项 的 组 合 。 
c: 创建 新 档案 文件 。 
f: 指定 目标 为 一 个 文件 而 不 是 一 个 设备 。 
t 列 出 档案 文件 的 内 容 ， 但 并 不 真正 释放 它们 。 
v (verbose): 显示 tar 命 令 执行 的 详细 过 程 。 
x: 从 档案 文件 中 释放 文件 。 
Z: 在 GNU 版 本 的 tar 命 令 中 用 gzip 命 令 压缩 档案 文件 i 

tar 命 令 还 有 许多 其 他 选项 ， 我 们 可 以 用 这 些 选 项 来 更 好 地 控制 tar 
Tee tee ree 。 详细 资料 请 参考 tar 命 令 的 手 

页 。 


口 口 口 口 口 口 


96 ”RPM 软件 包 


RPM 软件 包 管 理 程序 (RPM Package Manager) 或 简称 为 RPM 
(我 想 你 肯定 喜欢 这 样 一 种 递归 简写 的 方式 ) 一 开始 只 是 Red Hat 
Linux 的 软件 包 格 式 ， 它 最 初 的 名 字 为 Red Hat 软 件 包 管理 程序 (Red 
Hat Package Manager) .从 那 以 后 ，RPM 逐 渐 成 为 许多 其 他 Linux 发 行 
版 (包括 SUSE Linux) 所 接受 的 一 种 软件 包 格 式 ，Linux 标 准 化 规范 
(Linux Standards Base ， 简 称 为 LSB) 将 RPM 作为 其 官方 软件 包 格 

式 ，LSB 的 网 址 为 www.linuxbase.org ° 

下 面 是 RPM 的 主要 优点 。 

O “使 用 广泛 。 许 多 Linux 发 行 版 至 少 都 可 以 安装 RPM 软件 包 ， 或 

者 将 RPM 作为 它 的 标准 软件 包 格 式 。 RPM 还 被 移植 到 许多 其 他 的 

操作 系统 中 。 

O _ 它 能 够 只 用 一 条 命令 来 安装 软件 包 。 你 还 可 以 自动 安装 软件 

包 ， 因 为 RPM 就 是 专 为 方便 无 人 管理 设计 的 。 同 样 ， 删 除 或 升级 

软件 包 也 只 需 使 用 一 条 命令 。 

O 只 需要 处 理 一 个 文件 。 一 个 RPM 软 件 包 就 保存 在 一 个 单独 的 

文件 中 ， 这 使 得 在 不 同系 统 之 间 传 输 软 件 包 变 得 非常 容易 。 

O RPM 目 动 处 理 软件 包 之 间 的 依赖 关系 检查 。RPM 系 统 包 含 一 

个 数据 库 ， 该 数据 库 中 记录 了 已 安装 的 所 有 软件 包 的 信息 ， 包 括 

每 个 软件 包 所 提供 的 内 容 以 及 安装 每 个 软件 包 的 要 求 。 

Oo RPM 软件 包 被 设计 为 由 “最 干净 ”的 源 代 码 而 来 ， 从 而 可 以 对 

它 重 新 编译 。RPM 文 持 如 patch 这 样 的 Linux 工 具 ， 可 以 在 编译 过 

程 中 为 软件 的 源 代 码 打上 补丁 。 


9.6.1 RPM 软 件 包 

每 个 RPM 软 件 包 都 存储 在 一 个 以 。rpm 为 后 缀 名 的 文件 中 。 软 件 
包 文 件 通常 遵循 着 一 种 命名 规范 ， 它 的 结构 如 下 所 示 : 
name-version-release.architecture.rpm 

在 这 个 结构 中 ，mname 指 定 该 软件 包 的 通用 名 称 ， 例 如 对 于 MySQL 
数据 库 来 说 ， 它 就 是 mysql， 对 于 make 编 译 工 具 来 说 ， 它 就 是 make 。 


version 指 定 该 软件 的 版 本 号 ， 例 如 MySQL 的 版 本 5.0.41。 release, & 
一 个 数字 ， 它 指定 软件 包 的 RPM 版 本 号 。 这 个 版 本 号 非常 重要 ， 因 为 


RPM 软件 包 是 通过 一 组 指令 建立 的 (我们 将 在 9.6.3 节 中 介绍 这 方面 的 
AZ) ， 你 可 以 通过 release 来 跟踪 编译 指令 的 改动 情况 。 

architecture 指 定 程序 的 架构 ， 例 如 对 于 基于 Intel 的 系统 ， 它 为 
i386。 对 于 已 编译 好 的 程序 来 说 ， 它 非常 重要 ， 例 如 ， 针 对 SPARC 处 
理 器 创建 的 可 执行 程序 是 不 能 在 Intel 处 理 器 上 运行 的 。 architecture 的 
值 可 以 是 通用 的 ， 例 如 针对 SPARC 处 理 器 的 Sparc， 也 可 以 是 特定 的 ， 
例如 针对 v9 SPARC Xb X8 zx AY sparcv9 ， 或 针对 AMD Athlon its Fr BJ 
athlon ° 除非 你 强制 忽略 它 ， 否 则 RPM 系 统 将 阻止 安装 来 自 不 同 架 构 
的 软件 包 。 

如 果 architecture 设 为 一 个 特殊 的 值 noarch， 就 表示 该 软件 包 并 不 针 
对 某 个 特定 的 架构 ， 例 如 文档 、Java 程 序 或 Perl 模 块 。 如 果 architecture 
设 为 src， 束 表示 该 软件 包 为 RPM 源 代码 软件 包 ， 在 该 软件 包 中 包含 的 
是 源 文件 和 用 于 将 它 编译 为 二 进 制 RPM 软件 包 的 指令 。 大 多 数 你 可 以 
在 网 络 上 找到 的 RPM 软件 包 都 是 针对 某 个 特定 架构 预 编译 的 软件 包 ， 
这 主要 是 为 了 方便 用 户 的 安 疼 。 你 可 以 在 网 络 上 找到 数 千 种 预 编译 好 
的 RPM 软件 包 ， 它 们 将 省 去 你 编译 软件 的 麻烦 。 

此 外 ， 一 些 软 件 包 的 使 用 非常 依赖 于 某 个 特定 的 Linux 版 本 ， 针 对 
这 种 情况 ， 和 直接 下 载 一 个 预 编 译 好 的 软件 包 要 比 手工 测试 所 有 的 软件 
包 组 件 要 容易 得 多 。 例 如 ， 曾 经 有 一 个 802. 11b 无 线 网 络 软件 包 ， 它 是 
针对 某 个 特定 的 Linux 发 行 版 的 某 个 特定 内 核 补 丁 级 别 预 编译 的 软件 
包 ， 比 如 说 它 的 文件 名 为 kemel-wlan-ng-modules-rh9. 18-0.2.0-7- 
athlonrpm， 它 包含 的 是 一 个 内 核 模 块 ， 针 对 的 用 户主 机 为 AMD 
Athlon 4b i zs A Z& Zi; ^ Linux íT RedHat 9.0、 内 核 版 本 为 2.4.20- 
18 ° 


9.6.2 JER PMEK EFI 


你 用 rpm 命 令 来 安 闻 RPM 软件 包 ， 该 命令 的 语法 格式 很 简单 ， 如 
所 示 : 


rpm -Uhv name-version-release.architecture.rpm 


例如 : 
$ rpm -Uhv MySQL-server-5.0.41-0.glibc23.i386.rpm 

这 个 命令 将 安装 (或 是 升级 ) MySQL 数 据 库 服 务 器 软件 包 ， 该 软 
件 包 针对 的 是 Intel x86 架 构 的 系统 。 

rpm 命 令 还 提供 用 户 与 RPM 系统 交互 的 能 力 。 你 可 以 用 如 下 命令 
查询 某 个 软件 包 是 否 已 安装 : 


rpm -qa xinetd 


9.6.3 “创建 RPM 软件 名 


你 可 以 用 命令 rpmbuild 来 创建 一 个 RPM 软件 包 。 创 建 的 过 程 相对 
而 言 比较 简单 ， 如 下 所 示 。 

O “收集 你 需要 打包 的 软件 。 

O “创建 spec 文 件 ， 该 文件 描述 了 如 何 建立 软件 包 。 

o 用 rpmbuild 命 令 建立 软件 包 。 

由 于 RPM 软件 包 的 创建 可 能 会 非常 复杂 ， 为 了 便于 说 明 ， 我 们 在 
本 章 中 将 用 一 个 简单 的 例子 来 介绍 ， 该 例子 已 足以 说 明 如 何以 源 代 码 
或 二 进 制程 序 的 方式 来 发 布 一 般 应 用 软件 。 我 们 将 把 更 深奥 的 选项 和 
通过 打 补 丁 的 方式 提供 软件 包 文 持 留 给 有 兴趣 的 读者 来 研究 。 要 想 了 
解 更 多 与 pm 程序 相关 的 信息 ， 请 参考 rpm 程 序 的 手册 页 或 RPM 
HOWTO 文 档 (通常 可 以 在 /usr/share/doc 目 录 下 找到 ) ， 你 还 可 以 参考 
由 Eric Foster-Johnson 编 写 的 书 《Red Hat RPM 指南 》 ( Red Hat 
Press/Wiley 出 版 ) ， 该 书 的 在 线 有 版 本 位 于 
http://docs.fedoraproject.org/drafts/rpm-guide-en/ ° 
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myapp 的 RPM 软件 包 。 


1. 收 集 软件 


创建 RPM 软件 包 的 第 一 步 是 收集 你 需要 打包 的 软件 。 在 大 多 数 情 
况 中 ， 软 件 包括 应 用 程序 的 源 代码 、 一 个 构建 文件 (如 makefile 文 
件 ) ， 可 能 还 会 有 一 个 在 线 手册 页 。 

将 软件 所 涉及 的 文件 收集 到 一 起 的 最 简单 的 方法 是 将 所 有 相关 文 
件 打 包 到 一 个 tarball 文 件 中 ， 并 在 该 文件 的 名 字 中 包含 应 用 程序 名 和 
版 本 号 ， 例 如 myapp-1.0.tar.gz。 

你 可 以 修改 先前 的 makefile 文 件 Makefile6， 在 其 中 增加 一 个 新 的 
目标 ， 将 所 有 文件 打包 到 一 个 tarball 文 件 中 。 修 改 后 的 makefile 文 件 就 
命名 为 Makefile， 如 下 所 示 : 


BILIC 


dist: myapp-1.0.tar.gz 
myapp-1l.0.tar.gz: myapp myapp.1 
rm -rf myap ?p- 1.9 
mkdir my app 
~ PAIN PUR 1 at le myapp-1.0 
tar zcvf $% myapp- 


erm 5 的 目标 myapp-1.0.tar.gz 将 为 我 们 的 小 应 用 程序 的 源 
代码 创建 一 个 tarball 文 件 。 为 了 使 用 简便 ， 上 面 的 代码 还 在 makefile 文 
件 中 增加 了 一 个 调用 相同 命令 的 dist 目 标 。 你 可 以 运行 如 下 的 命令 来 创 
建 tarball 文 件 : 


$ make dist 


接 下 来 ， 你 需要 将 文件 myapp-1.0. tar. gz 复制 到 RPM 的 SOURCES 
目 孙 中 ， 对 于 Red Hat Linux A HK, dX H X 
为 /usr/src/redhat/ SOURCES; 对 于 SUSE Linux ?€ ti, 3X H R 
为 /usr/src/packages/ SOURCES。 执 行 的 命令 如 下 所 示 : 


$ cp myapp-1.0.tar.gz /usr/src/redhat/SOURCES 


RPM 系统 望 软件 的 源 文 件 以 tarbal 文 件 的 形式 放置 在 SOURCES 
目录 中 (当然 还 有 其 他 一 些 选 项 ， 但 这 种 情况 是 最 简单 的 ) 。 
SOURCES H 条 只 是 RPM3 : 统 所 需要 查找 的 几 个 目录 之 一 。 

RPM 系 统 需 要 5 个 目录 的 支持 ， 它 们 列 在 表 9-4 中 。 


X 9-4 


RPM m _# 
BUILD ppl Sony Ae? DN j Du 
ome eng tn ai RPM 软件 仿 存 放 在 这 全 日 录 中 
A19 ict PR ERE HR 
TM "um (RPM PF AS LE erm NOE IE spec fT, METEORA 
tr 5356 HP MCERPMR COO AGIT A 


在 RPMS 目 录 下 通常 会 有 一 组 针对 不 同 主 可 te 构 的 子 目 录 ， 例 如 
在 一 个 Intel x86 架 构 的 系统 中 ，RPMS 目 录 中 的 内 容 如 下 所 示 : 


> 1s RPMS 


E 认 情 况 下 ，Red Hat Linux 2: Ej 28 fE/usr/src/redhat H 5 fl) E 
RPM 软件 包 。 


这 个 日 录 是 特定 于 Red Hat Linux 的 。 其 他 Linux 发 行 版 会 使 用 
其 他 的 目录 ， 例 如 /usr/src/ packages ° 


一 旦 收集 好 RPM 软 件 包 所 需 的 所 有 源 文 件 ， 步 就 是 创建 spec 
文件 ， 该 文件 告诉 rpmbuild 命 A EA a RED 


2. 创 建 RPM Spec 文 件 


创建 spec 文 件 可 能 会 非常 让 人 伏 惧 ， 因 为 RPM 系 统 支持 的 选项 数 
以 千 计 。 幸运 的 是 ，RPM 系 统 为 大 多 数 选项 提供 了 合理 的 默认 值 。 在 
本 小 节 中 所 介绍 的 这 个 简单 例子 中 的 内 容 ， 应 该 能 满足 你 将 要 创建 的 
大 多 数 软件 包 的 需要 了 。 此 外 ， 你 还 可 以 从 其 他 的 spec 文 件 中 复制 你 
所 需要 的 命令 。 


KT spect FEFE 的 资源 可 以 从 其 他 的 RPM 软件 包 中 找 
到 。 你 可 以 安装 以 。src. rpm 为 后 缀 名 的 RPM 源 代码 软件 包 ， 并 查 
看 其 中 的 spec 文 件 ， 你 会 发 现 比 你 所 需要 的 还 要 复杂 许多 的 例 
子 ， 例 如 在 软件 包 anonftp、telnet、vnc 和 sendmail 中 的 spec 文 件 都 
是 一 些 比较 有 趣 的 例子 。 


此 外 ，RPM 系 统 的 设计 者 很 聪明 地 未 在 自己 的 系统 中 开发 男 一 套 
工具 来 取代 常用 的 编译 工具 ， 如 make 或 configure， 而 是 在 系统 中 包含 


了 许多 短小 的 功能 来 利用 makefile 和 configure 脚 本 文件 。 

在 本 例 中 ， 你 将 为 myapp 应 用 程序 创建 一 个 spec 文 件 myapp.spec。 
Kup unire EE * 版 本 号 以 及 与 软件 包 有 关 的 其 他 信息 的 定 
X, W PETZ: 


! Wiley Publishing, Ir 


RPM spec 文 件 中 的 这 部 分 内 容 常 被 称 为 导言 。 在 上 面 的 导言 中 ， 
最 重要 的 定义 是 Name、Version 和 Release。 它 们 在 本 例 中 分 别 被 定义 
为 myapp、1.0 和 1， 其 中 RPM 软件 包 的 版 本 (release) 为 1 是 因为 这 是 
你 第 一 次 演 试 建立 它 。 

Group 定义 的 作用 是 帮助 图 形 化 安装 程序 将 数 千 种 Linux 应 用 程序 
分 类 显示 。Distribution 定 义 软件 的 发 行 方式 ， 当 你 只 是 针对 某 一 个 
Linux {thx (如 Red Hat 或 SUSE Linux) 建立 软件 包 时 ， 它 的 定义 就 
显得 非常 重要 了 。 

在 spec 文 件 中 添加 注释 是 个 好 主意 。 如 同 shell 脚 本 和 makefile 文 
件 ，rpmbuild 命 令 把 在 该 文件 中 以 字符 # 开 头 的 行 看 作为 注释 ， 例 如 : 


# This line is a comment.. 


为 了 帮助 用 户 判 断 是 否 需 要 安装 你 的 软件 包 ， 你 可 以 在 spec 文 件 
中 提供 Summary (软件 的 摘要 ) 和 和 %description (软件 的 描述 ) ， 注 意 
上 述 两 个 定义 在 语法 上 的 不 一 致 ， 在 description 的 前 面 有 一 个 百 分 
号 %。 例 如 ， 你 可 以 按 如 下 方式 描述 你 的 软件 包 : 


al application 


used Gemonstrate development t 
ids it requires MySQL at or above 3.23 


%description 的 定义 可 以 持续 多 行 (通常 也 是 如 此 ) 。 

spec 文 件 可 以 包含 软件 依赖 关系 的 信息 ， 这 包括 两 方面 的 内 容 : 
软件 包 提 供 了 什么 和 软件 包 依 赖 什么 你 还 可 以 定义 源 代码 软件 包 依 
赖 什么 ， 例 如 指定 编译 软件 时 所 需要 的 特定 头 文件 ) 。 Provides 定 义 
了 软件 包 所 提供 的 功能 ， 例 如 : 


上 面 这 条 语句 声明 软件 包 定 义 了 一 个 假想 的 功能 goodness。 如 果 
没有 在 spec 文 件 中 定义 Provides ， 则 RPM 系 统 会 自动 添加 Provides 定 
义 ， 它 的 值 为 软件 包 的 name 定 义 ， 在 本 例 中 就 是 myapp。 当 有 多 个 软 
件 包 提 供 相 同 的 功能 时 ，Provides 定 义 就 非常 有 用 。 例 如 ，Apache 
Web 服 务 器 软件 包 提 供 的 功能 是 webserver， 而 其 他 的 软件 包 如 Thy， 它 
可 能 也 提供 完全 相同 的 功能 。 为 了 帮助 处 理 软件 包 之 间 的 冲突 ，RPM 
还 允许 指定 Conflicts (冲突 ) 和 Obsoletes (过 时 ) 信息 。 

可 能 最 重要 的 依赖 关系 信息 就 是 Requires 定 义 。 你 可 以 通过 它 定 
义 软件 包 正 常 运行 所 需 的 所 有 其 他 软件 包 。 例 如 ，Web 服 务 器 需要 网 
络 和 安全 软件 包 的 文 持 。 在 本 例 中 ， 你 定义 Requires 为 MySQL 数 据 
库 ， 版 本 要 在 3.23 及 其 以 上 。 它 的 语法 如 下 所 示 : 


T 如 条 只 需要 MySQL 数 据 库 的 文 持 ， 但 版 本 不 限 ， 那 么 可 以 使 用 如 
AE XL: 


如 果 需 要 的 软件 包 未 安装 ，RPM 将 阻止 用 户 安 装 该 软件 包 。 当 
然 ， 用 户 也 可 以 强制 安 狠 。 

RPM 系统 还 将 根据 情况 目 动 添加 一 些 依赖 关系 定义 ， 如 针对 shell 
脚本 的 /bin/sh、 针 对 Perl 脚 本 的 Pen 解释 程序 和 应 用 程序 需要 调用 的 任 
何 共享 函数 库 (后 级 名 为 .so 的 文件 )  。RPM 系 统 的 每 个 新 版 本 都 会 为 
目 动 依赖 关系 检查 添加 更 多 的 智能 。 

定义 完 需 求 后 ， 你 需要 定义 构成 应 用 程序 的 源 文件 。 对 于 大 多 数 
应 用 程序 来 说 ， 你 只 需 将 下 面 的 定义 复制 到 目 己 的 spec 文 件 中 即 可 : 


%{name} 语 法 指 问 一 个 RPM 宏 ， 在 本 例 中 ， 它 指 的 是 软件 包 的 名 
称 。 因 为 你 在 前 面 将 name 定 义 为 myapp， 所 以 rpmbuild 命 令 将 把 % 
fname} 扩 展 为 myapp， 同 样 ，%{version} 将 被 扩展 为 1.0， 这 样 完整 的 
文件 名 就 是 myapp-1.0.tar.gz。 rpmbuild 命令 将 在 前 面 提 到 过 的 
SOURCES 目 录 中 查找 这 个 文件 。 

这 个 例子 设置 了 一 个 Buildroot， 它 定义 了 一 个 用 于 测试 安装 的 目 
录 。 你 可 以 将 下 面 的 语句 复制 到 自己 的 spec 文 件 中 : 


设置 好 Buildroot 后 ， 你 就 可 以 将 应 用 程序 安装 到 Buildroot 定 义 的 
目录 中 了 。 你 可 以 使 用 变量 $8RPM_BUILD_ROOT 来 引用 它 ， 该 变量 可 
以 在 spec 文 件 中 的 所 有 shell 命 令 中 使 用 。 


在 定义 了 所 有 这 些 与 软件 包 相 关 的 设置 后 ， 下 一 步 束 是 定义 如 何 
建立 软件 包 了 。 建 立 过 程 一 共 分 为 4 个 主要 的 部 分 : 96prep ^ 96build ` 
9oinstallfll96clean ° 

顾名思义 ，%prep 部 分 用 于 完成 准备 工作 。 在 大 多 数 情 况 下 ， 你 
可 以 运行 宏 %setup， 使 用 -q 参 数 可 以 将 其 设置 为 安静 模式 ， 如 下 所 
ZN: 


ksetup -q 


%build 部 分 用 于 建立 应 用 程序 。 在 大 多 数 情 况 下 ， 你 只 需要 使 用 
make 命 令 ， 如 下 所 示 : 


tbuiid 


这 实际 上 就 是 RPM 系 细 | 用 你 先前 创建 makefile 文 件 所 做 工作 的 
_ zs 

%install 部 分 用 于 安装 应 用 程序 、 手 册页 和 其 他 文 持 文件 。 你 通常 
可 以 使 用 RPM 宏 %makeinstall 来 安 狠 程序， 它 将 调用 在 makefile 文 件 中 
定义 的 instal 目标 。 但 在 本 例 中 ， 为 了 显示 更 多 的 RPM 安 ， 你 将 手工 
安装 所 有 的 文件 ， 如 下 所 示 : 


| ndir)/myapp 


这 个 例子 在 需要 的 情况 下 将 创建 相应 的 目录 ， 然 后 安装 可 执行 程 
序 myapp 和 手册 页 myapp.1° 环境 变量 $8RPM_BUILD_ROOT 包 含 先 前 
定义 的 Buildroot 的 值 。 宏 %{_bindir} 和 %{_mandir} 将 分 别 被 扩展 为 当 
前 二 进 制程 序 目 录 和 手册 页 目录 。 


如 果 用 configure 脚 本 来 创建 makefile 文 件 ， 所 有 可 变 的 目录 名 
都 将 被 正确 地 在 你 的 makefile 文 件 中 设置 。 所 以 ， 在 大 多 数 情 况 
下 ， 你 不 需要 像 上 面 例子 那样 ， 手 工地 在 spec 文 件 中 指定 所 有 的 


EAD a ge eo 
安装 命令 。 


?6clean 目标 用 于 清理 所 有 由 rpmbuild 命 令 创建 的 文件 ， 如 下 所 


在 定义 了 如 何 建立 软件 包 后 ， 你 需要 定义 所 有 需要 安 朔 的 文件 。 
RPM 对 此 要 求 非常 严格 ， 为 了 能 够 正确 地 跟 路 每 个 软件 包 中 的 每 个 文 
件 ， 它 也 必须 如 此 。%files 部 分 定义 了 需要 包括 进 软件 包 的 所 有 文 


件 。 在 本 例 中 ， 你 只 有 两 个 文件 需要 放 在 二 进 制 软件 包 中 发 布 ， 它 们 
是 可 执行 程序 myapp 和 手册 页 myapp.1。 如 下 所 示 : 


tfiles 
&( bindir]/myapp 
t ( mandir)/myapp.:i 


RPM Z& in] LATER TE AR BA ER S TARE © DAD, UU 
FREE Le NSPE, VR AL Be ma SE AB SCA 7] RB RAR OR a 0] 
该 程序 。 你 可 以 通过 %post 脚 本 来 完成 这 一 任务 。 下 面 是 一 个 非常 简单 
的 %post 脚 本 的 例子 ， 它 仅 用 来 发 送 一 封 电 子 邮 件 : 


post 
mail root -s “syapp installed - please register" </dev/null 


你 可 以 在 服务 器 RPM 的 spec 文 件 中 看 到 更 多 的 %post 脚 本 的 例子 。 
下 面 是 这 个 小 应 用 程序 的 spec 文 件 的 完整 内 容 : 


| spec file for package myapp (Version 1.0) 
' 


Vendor Wrox Press 

Distriburion: Any 

Name: myepp 

Version: 1.0 

Release: l 

Packager: neilg$provider.com 

License: Copyright 2007 Wiley Publishing, Inc. 
Group Applícationa/Media 

Provides: goodness 

Requires mysql >= 3.23 

Buildroot k( tmppath) /*(name]-*[version]-root 
source: tiname)-B(versian) ar ,ZX 

Summary: Trivial application 


tdescription 

MyApp Trivial Application 

A trivial application used to demonstrate development tools. 
This version pretends it requires MySQL at or above 3.23 
Authors: Neil Matthew and Ríchard Stones 


torep 
tsetup -q 


thuiid 
make 


tinstall 

mkdir -p SRPM_EBUILD ROOTS{ bindir) 

madi: -p SRPM BOILD ROOTS ( mandir) 

install -m755 myapp $RPM_BUILD_ROOTR(_ bíndir)/myapp 
install -m755 myapp.1 SRPM BUILD ROOTS*( mandir) /myapp.1 


tclean 


rm -7f $RPM_BUILD_ROOT 


tpost 
mail root -s 'myapp installed = please register’ «/dev/null 


a files 
*(_bindir) /myapp 
t(_mandir)/myapp.1 


现在 你 已 准备 好 建立 RPM 软件 包 了 。 
3. 使 用 rpmbuild 命 令 建 立 RPM 软 件 包 
使 用 rpmbuild 命 令 来 建立 软件 包 的 语法 如 下 所 示 : 


rpmbuild -bBuildStage spec_file 


选项 -b 告 诉 rpmbuild 命 令 建 立 一 个 RPM 软 件 包 。 附 加 的 选项 
Buildstage 是 一 个 特殊 的 代码 ， 它 的 作用 是 告诉 rpmbuild 命 令 在 建立 时 
需要 做 到 哪 一 步 。 可 以 使 用 的 选项 如 表 9-5 所 示 
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如 果 要 同时 建立 一 济 制 和 源 代 友 RPM 软件 包 就 使 用 选项 -ba。 源 
代码 RPM 软 件 包 人 允许 你 重新 建立 二 进 制 RPM 软 件 包 

将 RPM 的 spec 文 件 复制 到 正确 的 SOURCES 目 录 (放置 应 用 程序 源 
代码 的 目录 ) 中 : 


$ cp myapp.spec /usr/src/redhat/SOURCES 


ue a 
通过 目录 /usr/src/ packages/SOURCES 建 立 的 ) : 


$ rpmbuild -ba myapp.spec 

Executing[&prep): /bin/sh -e /var/tmp/rpm-tmp.47290 
umask 022 

cd /usr/src/packages/BUILD 

ed /usr/src/packages/BUILD 

rm -rË myapp-1.0 

/usr/bin/grip -de /usr/src/packages/SOURCES/myapp-1.0.tar.gz 
tar -xf - 

STATUS=0 

'|* 0 =ne 0 ']* 

cd myspp-1.0 

++ [usr/bin/id -u 

+ '"[* 1000 = 0 ']" 

e+ /usr/bin/iíd -u 

* *[* 1000 = 0 ']' 

+ /bin/chmod -RË aerX,uew,g-w,o-w . 

+ exit 0 

Executing(#build): /bin/sh -a /var/tmp/rpm-tmp. 99663 
* umask 022 

* cd /usr/arc/packages/BUILD 

* lbin/rm -rt /var/tmp/myapp-1.0-root 

++ dirname /var/tmp/myapp-1.0-root 

+ /bin/mkdir -p /var/tep 
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执行 完 rpmbuild 命 令 后 ， 你 将 看 到 两 个 RPM 软件 包 : TERPMS H5& 
中 的 二 进 制 RPM 软件 包 ， 该 软件 包 放 置 在 相应 的 主机 架构 子 目 录 中 、 
如 子 目 录 RPMS/i586; 在 SRPMS 目 录 中 的 源 代码 RPM 软 件 包 。 
二 进 制 RPM 软 件 包 的 文件 名 将 类 似 下 面 这 样 : 


myapp-1.0-1.1586.rpm 


SPA PRR EDU A ERME AA ANTE] AST e 
源 代 码 RPM 软 件 包 的 文件 名 将 类 似 下 面 这 样 : 


myapp-1.0-1.src.rpm 


你 需要 以 超级 用 户 的 身份 来 安装 软件 包 。 但 在 建立 软件 包 
只 要 你 对 RPM 目录 (通常 


时 ， 你 并 不 需要 root 的 
是 /usr/src/redhat) 有 写 权 限 即 可 。 一 般 情 况 下 ， 你 不 应 该 以 root 
的 身份 来 创建 RPM 软件 包 ， 因 为 spec 文 件 中 可 能 会 包含 对 系统 造 


成 破坏 的 命令 。 


9.7 包 格 子 


虽然 RPM 是 一 种 流行 的 软件 发 布 方式 ， 它 允许 用 户 控制 软件 的 安 
装 和 节 载 ， 但 目前 还 有 其 他 几 种 具备 竞争 力 的 软件 包 格 式 。 一 些 软件 
仍然 以 打包 压缩 文件 (tgz) 的 方式 发 布 ， 这 些 软件 的 通常 安装 步 又 
是 : 首先 将 软件 包 释 放 到 一 个 临时 目录 中 ， 然 后 运行 一 个 脚本 文件 来 
执行 真正 的 安装 。 

Debian 和 基于 Debian 的 Linux 发 行 版 (以 及 一 些 其 他 的 Linux 发 行 
版 ) 支持 另 一 种 软件 包 格 式 dpkg， 它 在 功能 上 和 RPM 类 似 。 它 解 包 和 
安 效 通常 以 。deb 为 后 级 的 软件 包 文件 。 如 果 需 要 以 。deb 软 件 包 格式 
来 发 布 软件 ， 你 可 以 用 工具 Alien 将 RPM 软 件 包 转换 为 dpkg 格 式 。 有 关 
Alien 的 更 多 资料 请 参考 http://kitenet.net/programs/alien/。 


9.8 FA 


目前 为 止 ， 我 们 在 本 章 中 介绍 的 几乎 所 有 工具 基本 上 都 是 命令 行 
工具 。 具 有 在 Windows 系 统 上 开发 经 验 的 程序 员 毫 无 疑问 都 有 使 用 集 
成 开发 环境 (IDE) 的 经 历 。IDE 是 一 个 图 形 化 的 环境 ， 它 通常 会 将 用 
于 创建 、 调 斌 和 运行 应 用 程序 的 部 分 或 所 有 工具 集成 到 一 起 。 它 一 般 
至 少 会 提供 一 个 编辑 器 、 一 个 文件 浏 贤 器 和 一 种 运行 应 用 程序 并 捕获 
其 输出 结果 的 方法 。 更 完整 的 开发 环境 还 会 支持 从 模板 中 为 特定 类 型 
的 应 用 程序 生成 源 代码 文件 ， 集 成 源 代码 控制 系统 和 目 动 生成 文档 。 

在 下 面 几 方 中 ， 我 们 将 介绍 KDevelop 及 其 他 一 些 可 在 Linux 上 运行 
的 IDE。 这 些 IDE 都 正 处 于 积极 的 开发 过 程 中 ， 其 中 一 些 最 高 级 的 IDE 
已 具备 与 商业 软件 匹敌 的 质量 。 


9.8.1 KDevelop 


KDevelop 是 用 于 C 和 C++ 程序 的 IDE。 它 对 运行 在 K 蝎 面 环境 
(KDE) 中 的 应 用 程序 的 开发 提供 特别 的 文 持 ，KDE 是 当前 Linux 系 统 
中 两 大 主流 图 形 用 户 界面 之 一 。KDevelop 还 可 用 于 开发 其 他 类 型 的 项 
目 ， 包 括 人 简单 的 C 语 言 程序 。 
KDevelop 是 一 个 自由 软件 ， 它 是 根据 GNU 通 用 公共 许可 证 
(GPL) 的 条 款 发 布 的 ， 许 多 Linux 发 行 版 都 提供 了 该 软件 。 你 可 以 从 
http: /www.kdevelop.org 上 下 载 它 的 最 新 版 本 。 通 过 KDevelop 开 发 的 项 
目 在 默认 情况 下 都 遵循 GNU 项 目的 标准 。 例 如 ， 它 们 将 使 用 autoconf 
工具 来 生成 makefile 文 件 ，autoconf 将 根据 编译 该 软件 的 系统 环境 来 目 
动 调整 makefile 文 件 的 内 容 。 这 意味 着 项 目 可 以 以 源 代码 的 方式 发 布 ， 
并 且 很 有 可 能 能 够 在 其 他 系统 中 编译 通过 。 
使 用 KDevelop 开 发 的 项 目 还 包含 用 于 制作 文档 的 模板 、GPL 许 可 
证 文本 和 通用 的 安装 说 明 。 在 制作 新 的 KDevelop 项 目 过 程 中 产生 的 大 
量 文件 可 能 会 令 使 用 者 非常 展 惯 ， 但 如 有 果 你 曾经 下 载 并 编译 过 一 个 典 
型 的 GPL 应 用 程序 ， 那 么 就 不 会 对 这 些 文件 感到 阴 生 了 。 
KDevelop 支 持 CVS 和 Subversion 的 源 代 码 控 制 ， 应 用 程序 可 以 在 
不 离开 IDE 环 境 的 情况 下 被 编辑 和 调试 。 图 9-2 和 图 9-3 显 示 了 编辑 和 的 
1 C 语 言 应 用 程序 (这 是 另 一 个 Hello World! 程 
T) 的 情况 。 
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9.82 ”其 他 开发 环境 


目前 还 有 许多 其 他 的 编辑 器 和 IDE (自由 软件 和 商业 软件 ) 可 以 
或 正 处 于 开发 阶段 。 其 中 一 些 比较 有 趣 的 软件 列 在 
9-6 中 。 


表 9-6 


开发 环境 - M 产品 URL 

Eclipse MK Javai E IUE ACIDE http.//www.eclipse.otg 
Anjuta ^ GNOME IDE http://anjuta.scurceforge-nev 
QEZ {KDE IDE http:/projects.uidü. sk/qtez/ 


SlickEdit T MEME AE $1 Comm hitp://www.slickedit.comy 


99 小结 
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在 本 章 中 ， 你 看 到 了 一 些 Linux 开 发 工具 ， 它 们 使 程序 的 开发 和 发 
布 更 容易 管理 。 首 先 ， 你 使 用 make 和 makefile 文 件 来 管理 多 个 源 文 
件 ， 这 也 是 本 章 最 重要 的 内 容 。 然 后 ， 你 学 习 了 如 何 通 过 RCS 和 CVS 
来 控制 源 代码 ， 它 们 可 以 让 你 在 开发 代码 的 过 程 中 对 各 种 改动 进行 跟 
路。 授 下 来 ， 你 学 习 了 如 何 通 过 patch 命 令 、 带 有 gzip 压 缩 功 能 的 tar 命 
令 和 RPM 软件 包 来 发 布 软件 。 最 后 ， 你 学 习 了 一 个 IDE 工 具 
K Develop; 它 可 以 让 编辑 一 运行 一 调试 这 个 开发 周期 变 得 更 容易 一 


根据 美国 软件 工程 学 会 和 IEEE 的 研究 ， 每 个 重要 的 软件 最 初 都 
会 有 缺陷 。 一 般 来 说 ， 每 100 行 代码 会 有 两 个 左右 的 错误 。 这 些 错误 将 
导致 程序 和 函数 库 无 法 按照 需要 的 方式 执行 ， 这 通常 会 造成 程序 的 实 
际 执行 情况 和 预期 的 情况 不 同 。 在 软件 开发 过 程 中 ， 查 找 、 识 别 和 纠 
正 这 些 错误 将 耗费 程序 员 大 量 的 时 间 。 

在 本 章 中 ， 我 们 将 研究 软件 的 缺陷 ， 并 介绍 一 些 工 具 和 技术 来 捕 
提 错 误 行 为 的 特定 实例 。 这 与 程序 测试 〈 以 各 种 可 能 出 现 的 条 件 来 检 
验 程序 操作 情况 ) 是 不 同 的 ， 虽 然 测 试 和 调试 密切 相关 ， 并 且 许 多 错 
误 正 是 在 测试 阶段 被 发 现 的 。 

在 本 章 中 ， 我 们 将 介绍 下 面 一 些 主题 : 


常用 调试 技巧 
使 用 GDB 和 其 他 工具 进行 调试 
断言 


内 存 调 斌 


DODDDD 辣 


10.1 “错误 类 型 


有 几 种 原因 会 造成 程序 的 缺陷 ， 针 对 每 种 原因 ， 我 们 都 有 下 面 一 
些 建议 的 方法 用 来 查找 和 纠正 。 
口 ” 功 能 定义 错误 : 如 果 程 序 的 功能 被 错误 地 定义 了 ， 它 就 肯定 
不 能 完成 预定 的 工作 。 即 使 是 世界 上 最 优秀 的 程序 员 ， 有 时 也 会 
写 出 错误 的 程序 。 所 以 ， 在 开始 程序 设计 (或 规划 ) 之 前 ， 你 必 
须 确认 目 己 知道 并 理解 这 个 程序 究竟 是 用 来 干什么 的 。 认 真 分 析 
用 户 需 求 并 加 强 和 用 户 之 间 的 沟通 ， 有 助 于 查找 和 纠正 许多 (BU 
使 不 是 全 部 ) 程序 功能 定义 方面 的 错误 。 
口 “ 设 计 规 划 错 误 : 无 论 程序 规模 的 大 小 ， 在 创建 它们 之 前 都 需 
要 设计 规划 。 在 计算 机 键盘 前 坐 下 ， 直 接 敲 入 源 代 码 ， 然 后 期 户 
程序 能 一 次 通过 ， 这 样 的 情况 并 不 常见 。 对 程序 员 来 说 ， 一 定 要 
多 化 点 时 间 思 考 : 如 何 构造 程序 ， 需 要 什么 样 的 数据 结构 ， 它 又 
应 该 如 何在 程序 中 使 用 。 尽 量 把 这 些 细节 问题 提前 确定 下 来 ， 这 
样 将 节省 今后 很 多 改写 代码 的 时 间 。 
O “代码 编写 错误 : 当然 ， 每 个 人 都 会 出 现 键入 错误 。 根 据 设计 
来 创建 源 代码 的 过 程 并 不 是 一 个 不 会 出 错 的 完美 过 程 ， 许 多 程序 
错误 都 是 在 这 一 阶段 悄悄 潜入 的 。 在 程序 中 过 到 错 广 时 ， 要 重新 
阅读 源 代码 或 与 其 他 人 进行 探讨 ， 这 个 办 法 虽然 因为 简单 而 容易 
被 人 忽视 ， 但 它 却 非 常 有效。 你 肯定 会 对 目 己 通过 与 他 人 探讨 程 
序 的 具体 实现 而 能 够 得 找 并 纠正 的 错误 之 多 感到 惊讶 。 


像 C 语 言 这 样 带 有 编译 器 的 程序 设计 语言 有 一 个 优点 ， 它 的 
语法 错误 可 以 在 编译 阶段 检查 出 来 。 而 对 于 解释 型 的 语言 ， 如 
Linux shell, ， 则 只 能 在 程序 的 运行 阶段 才能 发 现 语法 错误 。 如 果 
问题 出 在 程序 的 错误 处 理 代码 部 分 ， 则 即使 在 程序 的 测试 阶段 ， 
也 不 容易 发 现 它 。 


D 可 以 试 着 在 纸 上 执 行程 序 的 核心 代码 ， 这 个 过 程 通常 被 称 为 
空运 行 (dry running) 。 针 对 那些 非常 重要 的 例 程 ， 先 记 下 它们 
的 输入 值 ， 然 后 逐步 手工 计算 出 输出 结果 。 调 试 程序 并 不 一 定 非 
要 用 计算 机 不 可 ， 有 时 ， 问 题 可 能 正 是 因为 计算 机 本 身 才 出 现 
的 。 即 使 是 编写 函数 库 、 编 译 右 和 操作 系统 的 程序 员 也 会 犯错 
ix nux, HAS LEA, NUR HUJUS 
误 的 可 能 性 要 比 编译 器 大 得 多 。 


目前 有 几 种 典型 的 调试 和 测试 Linux 程 序 的 方法 。 一 般 做 法 是 先 运 
行程 序 并 观察 其 输出 结果 ， 如 果 不 能 正常 工作 ， 我 们 就 需要 决定 应 该 
采取 哪些 措施 。 可 以 修改 程序 然后 重新 尝试 〈 代 码 检 查 - 试 运行 -出 错 
法 ) ， 也 可 以 在 程序 中 增加 一 些 语 句 来 获得 更 多 关于 程序 内 部 运行 情 
况 的 信息 (取样 法 ) ， 还 可 以 直接 检查 程序 的 执行 情况 ( 受 控 执行 
法 ) 。 程 序 调试 可 以 分 为 如 下 5 个 阶段 。 

o WA: 找 出 程序 中 存在 的 缺陷 或 错误 。 

O BW 让 程序 的 错误 可 重 现 。 

O FEAL: 确定 相关 的 代码 行 。 
口 
口 


纠正 : 修改 代码 纠正 错误 。 
验证 : 确定 修改 解决 了 问题 。 


我 们 先 来 看 一 个 有 漏洞 的 示例 程序 。 在 本 章 中 ， 我 们 将 对 其 进行 
调试 。 这 个 程序 是 在 某 大 型 软件 系统 的 开发 过 程 中 编写 的 ， 其 作用 是 
测试 函数 sort， 该 函数 的 功能 是 通过 冒 泡 排序 算法 对 一 个 类 型 为 item 的 
结构 数组 进行 排序 ， 有 具体 的 排序 方法 为 基于 结构 中 的 成 员 key 以 升序 排 
列 数组 成 员 。 程 序 用 一 个 样本 数组 来 测试 函数 sort。 在 现实 中 ， 我 们 可 
能 永远 也 不 会 使 用 这 个 算法 ， 因 为 它 的 执行 效率 实在 太 低 了 。 在 这 里 
使 用 这 个 算法 的 原因 在 于 它 比 较 短 小 ， 相 对 来 说 简单 易 懂 ， 而 且 也 更 
容易 出 错 。 事 实 上， 在 标准 的 C 函 数 库 中 已 经 有 一 个 完成 同样 功能 的 
函数 qsort 了 ° 

糟糕 的 是 ， 这 个 程序 的 可 读 性 比较 差 ， 里 面 没有 任何 注释 ， 也 不 
知道 最 初 的 程序 员 是 哪 一 位 ， 所 以 一 切 只 能 靠 我 们 自己 了 。 先 从 基本 
的 例 程 debugl.c 开 始 ， 下 面 是 该 文件 的 内 容 : 


- ' typecef struct 【 
* . «int 


har 1A 
int key 


我 们 来 编译 这 个 程序 : 
$ cc -o debugl debugl.c 
编译 过 程 很 顺利 ， 既 无 出 错 信息 也 无 警告 信息 
ISA TIA PSF ZA, 我 们 需要 在 程序 中 添加 一 些 代码 来 打印 出 结 
否则 就 不 会 知道 这 个 程序 是 否 正常 工作 了 。 这 些 代码 的 作用 是 


AR, 
示 排 序 后 的 数组 。 我 们 将 这 个 新 版 本 的 文件 命名 为 debug2.c， 如 下 所 
7R: 


printfl'array|'*d " ts, ta) 


严格 来 说 ， 这 些 额 外 的 代码 并 不 属于 程序 员 的 职责 范围 ， 加 上 它 
完全 是 因为 测试 工作 的 需要 。 添 加 这 些 代码 时 ， 我 们 必须 非常 小 辫 以 
避免 在 测 武 代码 中 引入 新 的 漏洞 。 现 在， 再 次 编译 ， 然 后 运行 程序 


S ec -o debug2 debug2.c 
$ ./de ‘aoa 


这 样 做 产生 的 输出 结果 取决 于 你 所 使 用 的 Linux (或 UNIX) 版 本 
及 其 具体 设置 情况 。 在 我 的 系统 上 运行 它 时 ， 得 到 的 输出 结果 是 : 


但 它 在 本 书 另 一 位 作者 的 系统 (运行 的 是 男 一 个 版 本 的 Linux 内 
TR) 上 运行 时 ， 给 出 的 输出 却 是 这 样 : 
Segmentation fault 


在 你 的 Linux 系 统 中 运行 这 个 程序 时 ， 你 可 能 会 看 到 其 中 一 种 输出 
结 末 ， 或 者 完全 不 同 的 另外 一 个 输出 结果 。 而 我 们 希望 看 到 的 输出 


E 
AE 


很 明显 ， 这 段 代码 存在 着 很 严重 的 问题 。 即 使 它 能 运行 ， 给 出 的 
排序 结果 也 是 错误 的 。 如 果 它 的 运行 产生 段 错误 (segmentation fault) 
而 被 终止 ， 残 说明 操作 系统 回程 序 发 送 了 一 个 信号 ， 告 诉 程序 操作 系 
统 检 测 到 了 非法 的 内 存 访问 ， 为 防止 内 存 空间 被 破坏 ， 操 作 系 统 提前 
终止 了 该 程序 的 运行 。 

探 作 系 统 检 测 非 法 内 存 访问 的 能 力 ， 取 决 于 它 的 硬件 配置 和 它 在 
内 存 管理 实现 方面 的 一 些 具体 做 法 。 在 大 多 数 系统 中 ， 探 作 系 统 分 配 
给 程序 的 内 存 一 般 都 会 比 程 序 实际 需要 使 用 的 大 一 些 。 如 果 非 法 内 存 
访问 出 现在 这 部 分 内 存 区 域内 ， 硬 件 就 可 能 检测 不 到 ， 这 惑 是 并 非 所 
有 版 本 的 Linux 和 UNIX 系 统 都 会 产生 段 错 误 的 原因 。 


ARE 〈 比 如 printf) 在 某 些 特殊 情况 下 (比如 使 用 了 一 
个 空 指 针 ) 也 会 阻止 非法 访问 操作 的 发 生 。 


如 果 想 捕捉 到 数组 访问 方面 的 错误 ， 最 好 增加 数组 元 素 的 大 小 ， 
因为 这 样 同时 也 增加 了 错误 的 大 小 。 如 采 只 是 在 数组 的 结尾 之 后 读 取 
一 个 字 世 ， 我 们 很 可 能 会 看 不 到 有 错误 发 生 ， 因 为 分 配给 程序 的 内 存 
大 小 会 取 整 到 操作 系统 的 特定 边界 ， 一 般 分 配 的 内 存 大 小 以 8K 为 单位 


递增 。 


如 果 增 加 数组 元 素 的 大 小 ， 比 如 在 此 例 中 将 item 结 构 中 的 成 员 data 
扩大 为 一 个 可 以 容纳 4 096 个 字符 的 数组 ， 对 不 存在 的 数组 元 素 进 行 访 
问 时 ， 内 存 地 址 就 有 可 能 落 在 分 配给 这 个 程序 的 内 存 之 外 的 地 方 。 
为 数组 的 每 个 元 素 大 小 为 4K， 所 以 我 们 错误 使 用 的 内 存 将 落 在 数组 结 
尾 之 后 的 OK 一 4K 范 围 内 。 

如 果 这 样 做 ， 并 将 修改 后 的 程序 命名 为 debug3.c， 它 将 在 两 位 作 
者 的 Linux 系 统 上 都 产生 段 错 误 。 如 下 所 示 : 


但 还 是 存在 着 这 样 的 可 能 性 ， 即 某 些 Linux 或 UNIX 版 本 仍然 不 会 
产生 上 段 错 误 。 当 C 语 言 的 ANSI 标 准将 某 种 行为 定义 为 “未 定义 * 时 ， 实 
际 上 它 还 是 允许 程序 运行 的 。 现 在 看 来 ， 我 们 所 写 的 这 个 C 语 言 程 序 
是 不 合 规范 的 ， 而 且 这 个 不 合 规范 的 C 语 言 程序 可 能 会 表现 出 非常 奇 
人 ee, (ut 
IPEN: o 


10.2.2 AEN 
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读 程 序 。 根 据 本 章 的 学 习 目 的 ， 我 们 假设 程序 代码 已 经 被 检查 过 ， 那 
些 比 较 明显 的 错误 也 都 已 经 被 排除 了 。 


代码 检查 这 一 术语 还 用 于 一 种 更 加 正式 的 场合 ， 一 组 开发 人 
员 逐 字 逐 句 的 检查 数 百 行 的 代码 。 但 代码 本 映 的 规模 大 小 其 实 并 
不 重要 ， 它 仍然 是 代码 检查 并 且 是 一 个 非常 有 用 的 技巧 。 


有 些 工 具 可 以 帮助 你 完成 代码 检查 工作 ， 编 译 句 就 是 其 中 比较 明 
显 的 一 个 。 如 采 程 序 有 语法 错误 ， 它 怠 会 告诉 你 。 


有 些 编译 器 还 有 用 来 针对 可 疑 行 为 产生 报警 的 选项 ， 比 如 未 
对 变量 进行 初始 化 、 在 条 件 判断 里 使 用 赋值 操作 等 。 举 例 来 说 ， 
GNU 编 译 器 在 运行 时 可 以 使 用 下 面 这 些 选 项 。 


11 pedanti -angi 


”这些 选 项 将 局 用 许多 警告 和 其 他 检查 来 检验 程序 是 否 符合 C 
语言 标准 。 我 们 建议 大 家 养 成 使 用 这 些 选 项 的 习惯 ,特别 是 -Wall 
选项 。 在 退 中 程序 的 错误 时 ， 它 可 以 产生 非常 有 用 的 信息 。 


我 们 将 在 稍 后 介绍 lint 和 splint 等 工具 。 与 编译 絮 一 样 ， 它 们 对 源 
代码 进行 分 析 并 报告 可 能 不 正确 的 代码 。 


10.2.3 ”取样 法 


取样 法 十 指 在 程序 中 深 加 一 些 代 码 以 收集 更 多 与 程序 运行 时 的 行 
为 相关 的 信息 的 方法 。 取 样 法 的 常见 做 法 是 ， 在 程序 中 添加 printf 函 数 
调用 以 打印 出 变量 在 程序 运行 的 不 同 阶段 的 值 ， 如 同 我 们 在 上 面 的 例 
子 中 所 做 的 那样 。 我 们 可 以 添加 多 个 printf 函 数 调用 ， 但 需要 注意 ,无 
论 何 时 程序 发 生 了 改动 ， 这 一 过 程 痢 将 市 来 更 多 的 编辑 和 编译 次 数 ， 
而 且 ， 在 程序 错误 被 修复 后 ， 我 们 还 要 把 这 些 额 外 的 代码 删除 挥 。 

在 这 里 可 以 使 用 两 种 取样 法 的 技巧 。 第 一 种 技巧 是 用 C 语 言 的 预 
处 理 器 有 选择 地 包括 取样 代码 ， 这 样 只 需 重新 编译 程序 整 可 以 包含 或 
去 除 调试 代码 。 实 现 方法 非常 简单， 只 需 使 用 如 下 的 语句 结构 : 


在 编译 程序 时 可 以 加 上 编译 占 标 志 -DDEBUG。 如 果 加 上 这 个 标 
志 ， 束 定义 了 DEBUG 符 号 ， 从 而 可 以 在 程序 中 包含 额外 的 调试 代码 ; 
如 有 果 未 加 上 该 标志 ， 这 些 调 试 代码 将 被 删除 。 我 们 还 可 以 用 数值 调试 
宏 来 完成 更 复杂 的 调试 应 用 ， 如 下 所 示 : 


在 这 种 情况 下 ， 我 们 必须 总 是 定义 DEBUG 宏 ， 但 我 们 可 以 设置 它 
为 代表 一 组 调试 信息 或 代表 一 个 调 斌 级别。 比如 编译 器 标志 - 
DDEBUG=5 将 启用 BASIC DEBUG fll SUPER. DEBUG， 但 不 包括 
EXTRA_DEBUG。 标 志 -DDEBUG=0 将 禁用 所 有 的 调试 信息 。 另 外 ， 
也 可 以 在 程序 中 添加 如 下 语句 。 这 样 ， 当 不 需要 调试 时 ， 就 不 必 在 命 
令 行 上 定义 DEBUG 安 : 


C 语 言 预 处 理 器 定义 的 一 些 宏 可 以 帮助 我 们 进行 调试 。 这 些 宏 在 
扩展 后 会 提供 当前 编译 操作 的 相关 信息 ， 如 表 10-1 所 示 。 
表 10-1 


注意 ， 这 些 符号 的 前 后 各 有 两 个 下 划 线 ， 这 古 标 准 的 预 处 理 占 符 
写 通 单 的 做 法 ， 你 应 该 注意 避免 选择 可 能 会 与 它们 冲突 的 符号 。 上 面 
说 明 中 的 术语 当前 指 的 是 预 处 理 操作 正在 执行 的 那 一 时 刻 ， 即 正在 运 
行 编译 器 对 文件 进行 处 理 时 的 时 间 和 日 期 。 


x 验 调试 信息 
请 看 下 面 这 个 程序 cinfo.c， 如 果 在 编译 它 时 局 用 了 调试 ， 就 会 打 
印 出 编译 时 的 日 期 和 时 间 : 


enait 


编译 这 个 程序 时 启用 调试 (用 -DDEBUG) ， 我 们 将 看 到 如 下 所 示 
的 编译 信息 : 
$ ec -o cinfo -DDEBUG cinfo.c 


试验 解析 

作为 编译 器 的 一 部 分 的 C 语 言 预 处 理 器 跟踪 记录 正在 编译 的 当前 
文件 和 文件 中 的 当前 行 。 当 它 在 代码 中 遇 到 符号 _LINE_ 和 _FILE_ 时 ， 
就 将 它们 替换 为 这 些 变量 的 当前 值 (编译 时 刻 ) ， 对 编译 日 期 和 时 间 
的 处 理 也 与 此 相同 。 因 为 DATE 4H TIME 都 是 字符 串 ， 所 以 我 们 可 
以 用 printf 函 数 的 格式 字符 串 把 它们 连 在 一 起 ，ANSI C 标 准 定 义 相 邻 的 
字符 串 可 以 被 看 作为 一 个 字符 串 。 


无 需 重新 编译 的 调试 技巧 
在 继续 学 习 新 的 内 容 之 前 ， 我 们 先 介 绍 一 个 使 用 printf 范 数 帮助 调 
试 的 技巧 ， 它 的 好 处 是 无 需 使 用 ##fdef DEBUG 语 句 ， 后 者 还 需要 重新 


编译 才能 开始 对 程序 进行 调试 。 

方法 是 在 程序 中 增加 一 个 作为 调试 标志 的 全 局 变量 ， 这 使 得 用 户 
可 以 在 命令 行 上 通过 -d 选 项 切换 是 否 启用 调试 模式 ， 即 使 程序 已 经 改 
布 了 ， 仍 然 可 以 这 样 做 ， 该 方法 同时 还 会 在 程序 中 增加 一 个 用 于 记录 
调试 信息 的 画 数 。 现 在 我 们 可 以 把 如 下 的 内 容 加 入 到 程序 代码 中 : 


你 应 该 将 调试 信息 输出 到 标准 错误 输出 stderr， 或 者 ， 如 果 因 为 程 
序 的 原因 不 能 这 样 做 ， 你 还 可 以 使 用 syslog 函 数 所 供 的 日 志 功 能 。 

如 果 用 这 种 调试 方法 来 解决 程序 开发 过 程 中 的 问题 ， 你 可 以 将 这 
些 代 码 一 直 留 在 程序 中 。 只 要 你 比较 齐 局 在意， 这样 做 将 古 相 当 安 全 
的 。 它 的 好 处 体现 在 : 当 程序 发 布 之 后 ， 如 果 用 户 遇 到 了 问题 ， 他 们 
目 己 就 可 以 在 运行 程序 时 打开 调试 功能 ， 目 己 完成 诊断 错误 的 工作 。 
在 出 现 问 题 时 除了 报告 段 错 误 外 ， 它 们 还 可 以 报告 出 当时 程序 正在 做 
什么 ， 而 不 仅 是 用 户 本 人 正在 做 什么 。 这 两 者 之 间 的 区 别 还 是 很 明显 


的 。 

当然 ， 这 样 做 也 有 一 个 明显 的 不 足 ， 就 是 程序 的 长 度 会 有 所 增 
加 。 但 在 大 多 数 情况 下 ， 它 只 是 一 个 表面 问题 ， 算 不 上 是 实际 意义 上 
的 问题 。 程 序 的 长 度 可 能 会 增加 20% 或 30%， 但 往往 并 不 会 对 程序 的 
性 能 造成 真正 的 影响 。 只 有 在 程序 的 长 度 提 高 儿 个 数量 级 时 ， 才 会 造 
成 程序 性 能 的 降低 。 


10.2.4 FEFK 行 


现在 回 到 示例 程序 ， 该 程序 有 一 个 漏洞 ， 我 们 可 以 修改 程序 ， 增 
加 一 些 代码 把 变量 在 程序 运行 时 的 值 打印 出 来 ， 或 者 还 可 以 用 调试 器 
来 控制 程序 的 执行 ， 随 时 查看 这 些 变量 的 状态 。 
商业 UNIX 系 统 中 有 许多 可 用 的 调试 器 ， 能 用 哪些 调试 器 取决 于 厂 
商 。 常 见 的 有 adb、sdb、idebug 和 dbx。 较 复杂 的 调试 器 可 以 在 源 代 码 
级 别 查看 程序 的 比较 详细 的 状态 信息 。GNU 的 调试 器 gdb (可 以 在 
Linux 和 许多 类 UNIX 系 统 中 使 用 ) 就 可 以 做 到 这 一 点 。 目 前 有 一 些 针 
对 gdb 的 “前 端 * 程 序 ， 它 们 提供 非常 友好 的 用 户 界 面 ，xxgdb、KDbg 和 
ddd 都 是 这 样 的 程序 。 一 些 IDE， 比 如 我 们 在 第 9 章 介 绍 的 ， 也 提供 了 
调试 功能 或 一 个 用 于 gdb 的 前 端 。Emacs 编 辑 器 甚至 还 提供 了 一 个 功能 
(gdb-mode) ， 人 允许 用 户 在 程序 上 运行 gdb， 设 置 断 点 并 查看 现在 执 
行 到 源 代码 中 的 哪 一 行 。 


为 了 能 够 调试 程序 ， 我 们 需要 在 编译 它 时 加 上 一 个 或 多 个 特殊 的 
编译 器 选项 。 这 些 选项 的 作用 是 让 编译 器 在 程序 中 添加 额外 的 调试 信 
息 。 这 些 信息 包括 各 种 符号 和 源 代码 行 号， 调试 器 将 利用 这 些 信息 向 
用 户 显示 程序 已 经 执行 到 源 代码 的 位 置 。 

-g 标 志 是 对 程序 进行 调试 性 编译 时 常用 的 一 个 选项 。 我 们 必须 在 
编译 每 个 需要 调试 的 源 文件 时 都 加 上 这 个 选项 ， 对 链接 器 也 要 这 样 做 
(编译 器 会 把 这 个 标志 自动 传递 给 链接 器 ) ， 它 将 使 用 特殊 版 本 的 C 
语言 标准 库 以 提供 库 画 数 中 的 调试 支持 。 对 那些 在 编译 时 没有 加 上 调 
试 功能 的 画 数 库 ， 虽 然 调试 工作 也 能 够 进行 ， 但 灵活 性 就 要 差 些 。 

调试 信息 的 加 入 将 使 可 执行 程序 的 长 度 成 倍增 加 (最 高 可 达到 10 
倍 ) 。 尽 管 可 执行 程序 的 容量 可 能 增加 了 (并 且 占用 了 更 多 的 磁盘 空 
间 ) ， 但 程序 运行 时 所 需要 的 内 存 数量 还 是 和 原来 一 样 。 程 序 调试 结 
束 后 ， 最 好 还 是 将 调试 信息 从 程序 的 发 行 版 本 中 删除 。 

你 可 以 用 命令 strip <file> 将 可 执行 文件 中 的 调试 信息 删除 而 不 需要 
重新 编译 程序 。 


我 们 将 使 用 GNU 的 调试 器 gdb 调 试 这 个 程序 。gdb 是 一 个 功能 很 强 
大 的 调试 须 ， 它 是 一 个 目 由 软件 ， 能 够 用 在 许多 UNIX 平 台 上 。 它 同时 
也 是 Linux 系 统 中 的 默认 调试 器 。gdb 已 被 移植 到 许多 其 他 的 计算 机 平 
台 上 ， 并 且 能 够 用 于 调试 嵌入 式 实时 系统 。 


10.3.1 ”启动 sdb 


现在 ， 对 我 们 的 示例 程序 进行 调试 性 编译 并 启动 gdb， 如 下 所 示 : 


brhr 


help 


gdb 本 身 是 一 个 基于 文本 的 应 用 程序 ， 但 它 为 一 些 重复 性 的 任务 准 
备 了 一 些 快捷 键 。gdb 的 许多 版 本 都 具备 市 历史 记录 的 命令 行 编辑 功 
fe, HPT (SRAD) 回 卷 并 再 次 执行 以 前 输入 过 的 命令 。 
它 的 所 有 版 本 都 支持 “ 空 命令 ”"， 即 直接 按 下 回 车 键 再 次 执行 最 近 执 行 


-ol 。 在 用 step 或 next 命 令 单 步 执行 程序 时 ， 这 个 “ 空 命令 ” 非 
T 
要 退出 gdb， 使 用 quit 命 令 即 可 。 


10.3.2 运行 一 个 程 


我 们 可 以 用 run 命 令 来 执行 这 个 程序 。 在 run 命 令 中 给 出 的 所 有 参 
ae 参数 传递 给 程序 。 在 本 例 中 ， 我 们 的 程序 无 需 任 何 

在 这 里 ， 我 们 假设 你 的 系统 和 本 书 两 位 作者 的 一 样 ， 都 产生 了 段 
背 误 。 如 果 情 况 并 非 如 此 ， 请 继续 往 下 看 。 如 果 在 编写 目 己 的 程序 时 
遇 到 了 段 错 误 ， 在 学 完 本 章 后 驶 应 该 知道 如 何 解 决 它 了 。 如 果 没 有 明 
到 过 段 销 误 ， 但 还 想 在 阅读 本 书 时 继续 使 用 这 个 示例 程序 ， 你 可 以 直 
到 那 时 我 们 已 把 这 个 程序 的 第 一 个 内 存 访 问 错 
误 修复 o 


与 前 面 一 样 ， 这 个 程序 运行 不 正确 。 程 序 运行 失败 时 ，gdb 会 报告 
HUE 。 现 在 我 们 即 可 根据 这 些 调查 这 个 问题 的 根本 原 
o 

根据 你 的 操作 系统 内 核 、C 函 数 库 和 编译 器 版 本 的 具体 情况 ， 你 
可 能 会 看 到 程序 的 错误 发 生 在 一 个 稍微 不 同 的 地 点 ， 比 如 发 生 在 交换 
数组 元 系 的 第 25 行 而 不 是 发 生 在 比较 数组 元 素 成员 key 的 第 23 行 。 如 采 
你 是 属于 这 种 情况 ， 则 应 该 看 到 如 下 所 示 的 输出 结果 : 


不 管 你 是 否 ?属于 这 种 情况 ， 你 都 可 以 沿 着 我 们 的 gdb 样 本 示例 继续 
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我 们 在 编译 程序 时 没有 添加 调试 信息 (cc-g) ， 就 无 法 看 到 程序 失败 
时 所 停 的 位 置 ， 也 无 法 用 变量 名 来 检查 数据 。 


p 以 用 backtrace 命 令 来 查 出 程序 是 如 何 到 达 这 一 位 置 的 ， 如 
ZN: 


b backtrace 


这 是 一 个 非常 简单 的 程序 ， 因 为 我 们 并 未 在 其 他 的 函数 中 调用 很 
多 函数 ， 所 以 跟 踩 信息 也 很 少 。 你 可 以 看 到 ，sort 函 数 是 由 同一 个 文件 
中 的 main 函 数 在 第 37 行 调用 的 。 通 常 在 实际 工作 中 遇 到 的 问题 要 复杂 
得 多 ，backtrace 命 令 将 帮助 我 们 找到 程序 到 达 错 误 地 点 的 路 径 。 当 调 
试 的 函数 可 能 会 从 许多 不 同 的 地 方 被 调用 时 ， 这 个 命令 将 非常 有 用 。 

backtrace 命 令 可 以 简写 为 bt， 为 了 与 其 他 调试 万 兼容 ，gdb 还 有 一 
个 命令 where 用 来 完成 相同 的 功能 。 


10.3.4 ”检查 变量 


gdb 在 停止 程序 时 给 出 的 信息 以 及 从 跟 躁 栈 得 到 的 信息 可 以 让 我 们 
看 到 函数 参数 的 取 值 。 

sort 函 数 被 调用 时 有 一 个 参数 a， 它 的 取 值 是 0x804a040。 这 是 数组 
的 地 址 ， 在 不 同 的 系统 中 这 个 值 通常 是 不 一 样 的 ， 这 要 视 用 户 使 用 的 
Fa FE ns PPR LE ASME © 
” ”错误 出 现在 第 23 行 ， 该 行 对 数组 的 两 个 元 素 进行 比较 ， 如 下 所 
Zh: 


23  */ if(a[jl].key > a[j*1].key) 1 
RITA LAA Vp o d E Et KS SN ^ Je 2 ERR AS eg GU EI VALER © 
print 命 令 的 作用 就 是 给 出 变量 和 其 他 表达 式 的 内 容 ， 如 下 所 示 : 
b) print j 
我 们 看 到 局 部 变量 j 的 值 是 4。gdb 会 用 伪 变 量 来 保存 类 似 这 样 的 输 
出 值 以 备 后 用 。 这 里 就 将 值 4 赂 给 了 伪 变 量 $1， 后 续 的 命令 将 把 它们 的 
输出 结果 依次 保存 到 $2、$3 等 中 去 。 
局 部 变量 的 值 是 4 意味 着 程序 尝试 执行 的 是 这 样 一 条 命令 : 


if(a[4].key > a[4*«1].key) 


我 们 传递 给 sort 男 数 的 数组 array 只 有 5 个 元 素 ， 它 们 的 下 标 从 0~ 
4。 因 此 ， 这 条 语句 读 的 是 一 个 不 存在 的 数组 元 素 array [5] » 循环 计数 
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变量 j 取 了 一 个 错误 的 值 。 
备 交换 数组 元 素 时 才 检 测 到 读数 组 越界 错误 的 ， 第 25 行 执行 的 语句 


an 
准 
是 
当 j 取 值 为 4 时 ， 真 正 执行 的 是 这 样 一 条 语句 : 
a[4] = al4+1]; 
我 们 可 以 用 print 命 令 的 表达 式 来 查看 处 理 过 的 数组 元 素 。gdb 介 许 
我 们 使 用 几乎 所 有 合法 的 C 语 言 表达 式 来 打印 变量 "数组 元 素 和 指针 
N 又 o 


gdb] print a[3] 
= lata = alex 


gdb 将 命令 的 结果 保存 在 伪 变 量 $<number> 中 。 最 后 一 次 操作 的 结 
果 总 是 为 圣 ， 倒 数 第 二 次 操作 的 结果 为 8$。 这 使 得 我 们 可 以 把 某 次 操 
作 的 结果 用 在 另 一 个 命令 中 。 例 如 ; 


gib) print a[$-1].key 


10.3.5” 列 出 程序 源 代码 


我 们 可 以 直接 在 gdb 里 用 list 命 令 列 出 程序 的 源 代码 。 这 个 命令 会 
打印 出 围绕 当前 位 置 前 后 的 一 段 代 码 ， 如 果 继续 使 用 list 命 令 ， 将 显示 
更 多 的 代码 。 你 也 可 以 给 list 命 令 提 供 一 个 行 号 或 画 数 名 作为 参数 ， 它 
将 显示 指定 位 置 前 后 的 代码 。 


ab list 


PA 


我 们 可 以 看 到 在 第 22 行 ， 循 环 被 设置 为 在 变量 j 小 于 n 时 继续 执 
行 。 而 在 本 例 中 ，n 等 于 5， 所 以 变量 j 的 最 大 取 值 为 4。 当 j 取 值 为 4 
时 ， 参 加 比较 的 数组 元 素 分 别 为 8[4] 和 a[5]。 对 这 一 特定 问题 的 一 种 解 
决 方法 是 ， 将 终止 循环 的 条 件 改正 为 j < n-1. 
我 们 对 程序 做 出 修改 ， 将 新 的 程序 命名 为 debug4.c， 重 新 编译 并 
TE: 


[vit 


- . for(i = 0 
ce -g -o debug4 debugs.c 
. / debug 


程序 的 运行 仍然 不 正常 ， 因 为 它 输 出 的 是 错误 的 排序 列表 。 下 面 
我 们 用 gdb 对 程序 的 运行 做 单 步调 试 。 


10.3.6 KAHA 


为 了 找 出 程序 失败 的 位 置 ， 我 们 需要 能 够 查看 程序 在 运行 时 所 做 
的 事情 。 我 们 可 以 通过 设置 断 点 在 任 一 位 置 停止 程序 的 运行 。 这 将 中 
肠 程 序 的 运行 并 将 控制 权 返 回 给 调试 硕 。 然 后 我 们 即 可 对 变量 进行 检 
查 并 让 程序 从 断 点 位 置 继 续 执 行 。 

在 sort 函 数 中 有 两 个 循环 。 外 层 循 环 针对 每 个 数组 元 素 执行 一 次 ， 
它 的 循环 计数 变量 是 i。 内 层 循 环 的 作用 是 交换 相 邻 的 两 个 元 素 。 总 的 
效果 是 让 比较 小 的 元 素 像 “气泡 ”一 样 “ 冒 ”到 数组 的 顶部 。 外 层 循环 每 
执行 一 次 ， 数 组 中 最 大 的 元 素 就 会 “下 沉 ” 到 数组 的 的 部 。 我 们 可 以 通 
过 在 外 层 循 环 中 停止 程序 的 运行 并 检查 数组 的 状态 来 核实 这 一 点 。 

有 许多 命令 可 以 用 来 设置 断 点 。 用 gdb 的 help breakpoint 命 令 可 以 
列 出 这 些 命令 ， 如 下 所 示 : 


i help breakpoint 


在 第 21 行 设置 一 个 断 点 ， 然 后 运行 这 个 程序 ， 如 下 所 不: 
> gdb debug4 
break 21 


run 


我 们 可 以 打印 出 数组 元 素 的 值 ， 然 后 用 cont 命 令 继续 执行 程序 。 
程序 会 一 直 运 行 直到 它 过 到 下 一 个 断 点 ， 在 本 例 中 束 是 它 再 次 执行 到 
第 21 行 的 时 候 。 在 同一 时 间 程 序 中 可 以 存在 许多 个 断后 。 


print array[0] 
if - 


要 想 打 印 出 一 组 连续 的 数据 项 ， 我 们 可 以 使 用 @<number> 让 gdb 
打印 出 指定 数目 的 数组 元 素 。 如 采 要 把 数组 中 的 所 有 元 聚 都 打印 出 
来 ， 使 用 的 命令 如 下 所 示 : 


i print array[0]@5 


注意 : 我 们 对 输出 结果 做 了 些 整理 ， 让 它们 更 容易 了 阅读。 因为 这 
是 第 一 次 进入 循环 ， 所 以 数组 未 发 生变 化 。 继 续 执 行程 序 ， 随 着 程序 
的 进展 ， 我 们 将 看 到 数组 array 的 后 续 变 化 : 


t 


b! print array[0]@5 


”我 们 可 以 用 display 命 令 告诉 sdb， 在 每 次 程序 停 在 断 点 位 置 时 自动 
显示 数组 的 内 容 ， 如 下 所 示 : 


display array[0]85 


此 外 ， 我 们 可 以 修改 断 点 设置 ， 使 程序 不 是 在 断 点 处 集 下 来 ， 而 
只 是 显示 要 查看 的 数据 ， 然 后 继续 执行 。 我 们 用 commands 命 令 来 完成 
这 一 工作 。 它 的 作用 是 指定 在 程序 到 达 断 点 位 置 时 需要 执行 的 调试 着 
命令 。 因 为 我 们 已 设置 了 display 命 令 ， 所 以 只 需 设 置 断 点 命令 为 继续 
执行 即 可 。 如 下 所 示 : 


commands 


cont 
ond 


现在 ， 当 程序 继续 执行 时 ， 它 将 一 直 执行 到 结束 ， 外 层 循环 每 次 
执行 都 会 打印 出 数组 的 内 容 ， 如 下 所 示 : 


| gdb 报 告 这 个 程序 在 退出 时 带 有 一 个 不 常见 的 退出 码 ， 这 是 因为 程 
序 本 喘 未 调用 exit 范 数 ， 并 且 也 没有 从 main 函 数 返 回 一 个 值 。 本 例 中 的 
退出 码 没有 实际 意义 ， 只 有 exit 函 数 才 会 提供 有 意义 的 退出 码 。 


看 上 去 程序 执行 外 部 循环 的 次 数 少 于 预期 值 。 我 们 可 以 看 到 ， 循 
环 终止 条 件 中 使 用 的 参数 n 的 值 在 每 次 到 达 断 点 时 都 在 减少 。 这 意味 着 
循环 不 会 执行 足够 的 次 数 。 问 题 出 在 程序 的 第 30 行 ， 该 行 对 变量 n 做 了 
减法 操作 ， 如 下 所 示 : 


上 上面 这 行 语句 是 出 于 优化 程序 的 考虑 ， 每 次 外 部 循环 结束 时 ， 数 
组 array 中 最 大 的 元 素 将 侦 放 到 数组 的 最 奈 部 ， 所 以 下 一 次 执行 外 部 循 
环 时 束 没 有 必要 考虑 数组 的 最 后 一 个 元 素 了 。 但 是 ， 正 如 我 们 所 看 到 
的 ， 这 个 优化 措施 影响 了 外 部 循环 并 引发 了 问题 。 针 对 这 一 问题 的 最 
简单 的 解决 方法 (当然 还 有 其 他 方法 ， 就 是 删除 引起 问题 的 一 行 。 下 
面 我们 束 通 过 用 调试 器 打上 补丁 的 方法 来 解决 ， 看 看 是 否 能 成 功 。 


我 们 已 经 看 到 ， 我 们 可 以 通过 调试 器 设置 断 点 和 查看 变量 的 取 
值 。 通 过 将 断 点 的 设置 与 相应 的 操作 结合 起 来 ， 就 可 以 等 斌 修改 程序 
(也 被 称 为 打 补 丁 ) 而 不 需要 改变 程序 的 源 代码 并 重新 编译 。 在 本 例 
中 ， 我 们 需要 在 程序 的 第 30 行 中 断 程序 ， 增 加 变量 n 的 值 ， 这 样 ， 程 序 
执行 到 第 30 行 时 ，n 的 值 并 未 发 生变 化 。 

重新 开始 执行 这 个 程序 。 首 先 ， 必 须 删 除 刚才 设置 的 断 点 和 
display 命 令 的 内 容 。 我 们 可 以 用 info 命 令 查看 曾经 设置 过 的 断 点 及 
display 命 令 的 内 容 ， 如 下 所 示 : 


info display 


! info break 


我 们 可 以 禁用 这 些 设置 也 可 以 将 其 全 部 删除 。 如 果 禁 用 它们 ， 
我 们 束 可 以 在 今后 必要 的 时 候 重 新 启用 这 些 保留 的 设置 ， 如 下 所 示 : 


disable break 1 
rib! disable display 1 
D) break 30 


jib| commands 2 
set variable n = n+l 
con 


end 
run 


程序 一 直 运 行 到 结束 并 给 出 了 正确 的 结果 。 我 们 现在 即 可 对 源 代 
码 进行 修改 并 用 更 多 的 数据 对 它 进 行 测 试 了 。 


10.3.8 ”深入 学 习 gdb 


GNU 调 试 占 是 一 个 功能 非 第 强大 的 工具 ， 它 可 以 为 我 们 提供 许多 
与 执行 中 的 程序 的 内 部 状态 有 关 的 信息 。 在 支持 人 硬件 断 点 功能 的 系统 
上 上， 可 以 用 gdb 实 时 监控 变量 取 值 的 变化 情况 。 人 硬件 断 点 是 某 些 CPU 提 
供 的 功能 ， 这 些 处 理 器 可 以 在 触发 某 个 特定 条 件 (一 般 为 对 某 个 给 定 
区 域 的 内 存 访问 操作 ) 时 自动 停止 运行 。 此 外 ，gdb 还 可 以 监控 表达 
式 ， 即 当 某 个 表达 式 取 了 一 个 特定 值 时 ，gdb 可 以 暂 集 程序 的 运行 ， 而 
人 
SAN] o 

断 点 可 以 和 计数 、 条 件 结合 在 一 起 设置 ， 只 有 在 经 过 了 指定 的 次 
数 或 满足 某 个 条 件 时 才 触 发 晰 点 。 


gdb 还 可 以 将 其 自身 附 在 已 经 运行 的 程序 上 。 这 对 调试 客户 /服务 
锅 系 统 很 有 帮助 ， 因 为 你 可 以 在 异常 服务 絮 正 在 运行 时 对 其 进行 调 
试 ， 而 不 必 先 停止 它 ， 然 后 再 重启 它 。 你 可 以 在 编译 程序 时 用 如 gcc -o 
-g 这 样 的 命令 来 同时 获得 程序 优化 和 调试 信息 的 好 处 。 但 这 样 做 的 缺 
点 是 ， 优 化 可 能 会 对 程序 代码 的 先后 顺序 进行 调整 ， 因 此 ， 在 对 代码 
进行 单 步调 试 时 ， 你 可 能 会 发 现 你 要 在 代码 中 跳 来 跳 去 以 达到 与 原来 
的 源 代码 同样 的 效果 。 

我 们 还 可 以 用 gdb 来 调试 已 经 月 溃 的 程序 。 程 序 运 行 失 败 时 ， 
Linux 和 UNIX 系 统 通常 会 产生 一 个 核心 转 储 (core dump) ， 并 将 它 保 
存在 core 文 件 中 。 这 个 文件 其 实 是 程序 的 内 存 映像 文件 ， 它 包含 程序 
在 运行 失败 的 那个 时 刻 的 全 局 变量 的 取 值 。 你 可 以 用 gdb 找 出 程序 发 生 
毅 沁 的 位 置 。 详 细 的 资料 请 查阅 gdb 的 手册 页 。 

gdb 遵 守 GPL 的 条 款 ， 大 多 数 UNIX 系 统 都 支持 它 。 我 们 强烈 建议 
读者 掌握 这 一 工具 。 


ER T Redbi E ERIR, Linux BZ — ARIAS be Het Ze BE 
够 帮助 你 完成 调试 工作 的 其 他 工具 。 其 中 有 的 是 提供 关于 程序 的 静态 
信息 ， 男 外 一 些 则 是 提供 动态 分 析 。 

静态 分 析 只 能 通过 程序 的 源 代码 提供 信息 。ctags、cxref 和 cflow 等 
就 是 一 些 静 态 分 析 程 序 ， 它 们 可 以 通过 源 文 件 提 供 有 关 芳 数 调用 和 瑟 
数 所 在 位 置 的 有 用 信息 。 

动态 分 析 提 供 的 是 与 程序 执行 过 程 中 的 行为 有 关 的 信息 。prof 和 
gprof 等 就 是 一 些 动 态 分 析 程 序 ， 它 们 提供 的 信息 包括 已 经 执行 了 哪些 
KRUA AX EE CIAM TERT IR]. 。 

下 面 我 们 将 介绍 其 中 一 些 工具 及 其 输出 。 虽 然 这 些 工 具 中 的 大 部 
RE 但 并 非 在 所 有 的 系统 中 都 可 以 使 用 所 有 
这 些 工具 。 


10.4.1 lint: 清理 程 Jr 


早期 的 UNIX 系 统 提供 了 工具 lint， 从 本 质 上 看 ， 它 只 是 C 语 言 编译 
器 的 一 个 前 端 ， 但 增加 了 一 些 常识 性 的 测试 并 可 以 产生 一 些 警 告 信 
息 。 它 可 以 检测 出 未 经 赋值 的 变量 使 用 、 函 数 的 参数 未 使 用 等 情况 。 
最 新 的 C 语 言 编 译 器 也 可 以 产生 类 似 的 警告 信息 ， 但 这 是 以 损失 
编译 过 程 的 性 能 为 代价 的 。lint 本 身 已 经 落后 于 C 语 言 的 标准 化 工作 
了 ， 因 为 这 个 工具 是 基于 早期 的 C 语 言 编译 器 开发 的 ， 它 已 不 能 很 好 
地 处 理 ANSI C 的 语法 了 。1lint 有 一 些 适 用 于 UNIX 系 统 的 商业 版 本 ， 在 
因特网 上 至 少 有 一 个 版 本 是 针对 Linux 系 统 的 ， 它 的 名 字 是 splint， 过 
去 常 把 它 称 为 LClint， 它 是 MIT (MERLE) 的 为 正式 规范 开发 工 
具 软 件 这 一 项 目的 组 成 部 分 。 类 lint 工 具 splint 可 以 提供 有 用 的 代码 审 
查 注 释 ， 该 软件 可 以 在 http://wwwi.splint.org 上 找到 。 
WR a ee Neo es 
debug0.c) : 


这 个 版 本 在 第 20 行 有 一 个 问题 ， 它 使 用 的 是 操作 符 & 而 不 是 &&。 
针对 这 个 版 本 的 splint 示 例 输 出 经 过 编辑 后 显示 在 下 面 。 注 意 它 是 如 何 
发 现 第 20 行 的 问题 的 一 一 程序 没有 初始 化 变量 s， 而 且 这 个 不 正确 的 操 
作 符 可 能 会 给 条 件 测 试 沉 来 问题 。 


neiiGsugel03;:~/BLP4e/chapteri0> splint -strict debug).c 
Splint 3.1.1 --- 19 Mar 2005 


debugd.c:7:18: Read-only string-literal storage used es initial value for 
unqualified storage: array[0].data = *bill* 
A read-only string literal is assigned to a non-observer reference, (Use 
-readonlytrans to inhibit warning) 
debug0.c:8:26: Read-only string literal storage used as initial value for 
unqualified storage: array[1].dsta = ‘neil* 
debug0.c:9:18: Read-only orring literal storage used as initial value for 
unqualified storage: array{2].data = "john" 
dehug0.c:10:18: Read-only string literal storage used as ínitisl value for 
unqualified storage: array[3) data = "sick" 
Gebugd.c:11:18; Read-only string literal storage used ag initial value for 
unqualified storage: array[4].data = *alex* 
Gebug0.c:16:22: Old style function declaration 
Function definition is in old style syntax. Standard prototype syntax is 
preferred. (Use -oldstyle to inhibit warning) 
debug0.c: {in function sort) 
debug0.c:20:31: Variable s used before definition 
An rvalue is used that may not be initialized to a value on some execution 
path. (Use -usedef to inhibit warning) 
6ebug0.c:20:23: Left operand of & is not unsigned value (boolean): 
i*«nást!-0 
An operand to a bitwise operator is not an untigned values. This may have 
unexpected results depending on the signed representations. (Use 
-bitwisesigned to inhibir warning) 
debug0.c:20:23: Test expression for for not boolean, type unsigned int: 
i«n&st!-0 
Test expression type is not boolean or int. (Use -predboolint to inhibit 
warning! 
debug0.c:25:41: Undocumented modification of all: aff] = aff + 11 
An externally-visible object is modified by a function with no /*@modifiess*/ 
comment. The /*@modifies ... 9*/ control comment can be used to give a 
modifies list for an unspecified function. (Use -modnomodg to inhibit 
warning) 
dehug0.c:26;41: Undocumented modification of a[]: alg +1) = t 
debug0.c:20:23: Operands of & are non-integer {boolean} (in post ioop test]: 
ien&uie0 
A primitive operation does not type check atríctly. (Use -strictops to 
inhibit warning! 
debug0.c:32:14: Path with no return in function declared to return int 
There is a path through a function declared to return a value on which there 
is no return statement. This means the execution may fall through without 
returning a meaningful result to the caller. [Use -noret to inhibit warning) 
debug0.c:34:13: Function main declared without parameter list 


splint 工 具 抱 怨 程 序 中 有 老式 的 〈 非 ANSI 标 准 ) 函数 声明 ， 并 且 
函数 返回 类 型 与 它们 真正 的 返回 值 〈 或 没有 返回 值 ) 不 一 致 。 这 些 虽 
“影响 程序 的 执行 ， 但 应 该 引起 注意 。 它 还 发 现 了 两 个 真正 的 漏洞 ， 

它们 出 现在 下 面 这 段 代码 中 : 


* 45 * 


splint 发 现 〈 前 面 输出 中 的 阴影 部 分 ) 第 20 行 使 用 的 变量 s 未 经 初 
台 化 ， 并 且 在 该 行 应 该 使 用 更 币 见 的 操作 符 && 而 不 是 现在 使 用 的 操 
作 符 &。 在 本 例 中 ，& 操 作 符 改变 了 测试 的 含义 ， 确 实 是 这 个 程序 存 
在 的 一 个 问题 。 

这 些 错误 都 在 调试 开始 之 前 的 代码 审查 阶段 惑 得 到 了 修复 。 虽 然 


它们 十 我 们 为 了 演示 而 有 意 放 在 那里 的 ， 但 在 真正 的 程序 中 ， 这 些 错 
误 可 以 说 十 屡见不鲜 。 


ctags, cxref 和 和 cflowj 这 3 个 工具 构成 了 X/Open 规范 的 一 部 分 内 容 ， 
因此 ， 具 备 软 件 开发 能 力 的 UNIX 系 统 都 会 有 这 3 个 工具 。 


这 些 工 具 以 及 本 章 介 绍 的 其 他 一 些 工具 可 能 没有 被 包括 在 你 
的 Linux 发 行 版 中 。 如 果 是 这 样 ， 你 就 需要 在 因特网 上 搜索 它们 。 
比较 好 的 搜索 网 站 (对 支持 RPM 软 件 包 格式 的 Linux 发 行 版 来 说 ) 
是 http://rpmfind.net 和 http://rpm.pbone.net。 你 还 可 以 党 试 一 些 发 行 
版 特定 的 软件 库 ， 如 tf 对 openSUSE 的 
http:/ftp.gwdg.de/pub/opensuse/、 针 对 Fedora 的 http:/rpm.livna.org 
和 针对 Slackware 的 http:/packages.slackware.it/. 


1.ctags 


ctags 为 程序 中 的 所 有 函数 创建 夫 引 。 每 个 琅 数 对 应 mE 
e s UHR BUR PARA B85] °F Tile 
FAYE: 


Em BW, "tags te 前 目录 下 创建 文件 tags。 在 该 文件 中 包 
£u ds AERE a T ERST Sc Frat et AAT Ps 


im 


文件 中 的 每 行 由 本 数 名 、 Pi — 数 的 文件 和 一 个 可 以 用 来 在 文 
件 中 查找 该 函数 定义 的 正则 表达 式 组 成 。Emacs 等 编辑 器 可 以 用 这 类 
文件 来 帮助 程序 员 浏 览 源 代 码 。 

此 外 ， 还 可 以 使 用 ctags 的 -x 选项 (如 果 你 使 用 的 版 本 有 该 选项 ) 
在 标准 输出 上 列 出 类 似 上 面 格式 的 内 容 : 

find_cat 403 app_ui.c static cdc_entry find_cat( 

OR n] DAFA Bice 0 an h EEE AAA, aA H-a 
选项 将 输出 结果 附加 到 一 个 已 有 文件 的 结尾 。 


2.cxref 


cxref 程 序 分 析 C 语 言 产 代 码 并 生成 一 个 交叉 引用 表 。 它 可 以 显示 
每 个 符号 (变量 、 #define 定 义 和 丽 数 ) 都 在 程序 的 哪个 位 置 使 用 过 。 
它 生 成 的 是 一 个 经 过 排序 的 列表 ， 每 个 符号 的 定义 位 置 用 一 个 星 号 
(=) 做 标记 ， 如 下 所 示 : 


在 我 的 机 器 上 ， 上 面 的 输出 结果 是 在 一 个 应 用 程序 的 源 代 码 目录 
中 产生 ， 使 用 的 命令 如 下 所 示 : 

$ cxref *. c *. h 
但 这 个 命令 的 正确 语法 格式 随 版 本 的 不 同 而 不 同 。 请 参考 系统 文档 或 
手册 页 来 了 解 cxref 命 令 的 更 多 信息 。 


3.cflow 


cflow 程 序 打印 出 一 个 函数 调用 树 (function call tree) ， 它 显示 了 
函数 之 间 调 用 的 关系 。 它 可 以 让 我 们 看 清楚 一 个 程序 的 框架 结构 ， 理 
解 它 的 操作 流程 ， 了 解 对 某 个 函数 的 改动 将 会 产生 怎样 的 影响 。 有 些 
版 本 的 cflow 除 了 可 以 处 理 源 代码 外 ， 还 可 以 处 理 目 标 文件 。 详 细 的 用 
法 请 参考 它 的 手册 页 。 

下 面 古 cflow 版 本 2.0 的 一 些 样本 输出 ， 该 版 本 可 以 从 因特网 上 得 
到 ， 它 由 Marty Leisner 人 负责 维护 : 


这 个 输出 样本 告诉 我 们 main 了 范 数 调用 show_all_lists 范 数 (以 及 
其 他 一 些 函 数 ) ,show_all_ lists 又 调用 了 display_list， 而 display_list 本 号 
调用 T printf ° 

这 个 版 本 的 cflow 有 一 个 i 选项 ， 它 将 产生 一 个 反 向 的 画 数 调用 
树 。 针 对 每 个 函数 ，cflow 列 出 调用 它 的 其 他 函数 。 听 起 来 好 像 很 复 
洒 ， 但 实际 上 很 简单 ， 下 面 是 一 个 样本 。 


BA «T AA HEU US EN a Val H T exit ER Bk, Eff] main ^ 


show. all listsfllusage. 


10.4.3 用 profgprof 产 生 执 行 存 档 


想 查 找 程序 的 性 能 问题 时 ， 一 种 常用 的 技巧 是 使 用 执行 存档 
(execution profiling) 。 它 通常 需要 特殊 的 编译 器 选项 和 辅助 程序 的 
BLEU 可 以 显示 执行 它 所 花费 的 时 间 有 具体 都 用 在 什么 
ae o 
编译 程序 时 ， 给 编译 器 加 上 -p 标 志 (针对 prof 程 序 ) 或 -pg 标志 
(针对 gprof 程 序 ) 就 可 以 创建 出 profile 程 序 。 而 prof 程 序 (及 其 GNU 
等 效 程序 gprof) 可 以 根据 profile 程 序 运行 时 所 产生 的 执行 跟踪 文件 打 
印 出 一 个 报告 。 编 译 命令 如 下 所 示 : 
$cc -pg -0 program program. c 
程序 用 特殊 版 本 的 C 语 言 琅 数 库 链 接 起 来 并 且 将 包括 监控 代码 。 
不 同 的 系统 具体 实现 方法 有 所 不 同 ， 但 一 般 都 要 靠 程 序 的 频 党 中 断 来 
记录 执行 地 点 。 监 控 数 据 将 被 写 入 当前 目录 下 的 文件 mon.out (gprof 程 
序 用 的 是 gmon.out) 。 如 下 所 示 : 


./program 
s -ls 


prof/gprof 程 序 读 取 监控 数据 并 生成 一 个 报告 。 程 序 选项 的 细节 请 
参考 它 的 手册 页 。 下 面 是 一 些 《有 所 删节 ) gprof 程 序 的 输出 示例 : 


PM RE PRI p 
Sette ew a UN 
SR 20b: 10 ED i 
cooooocooo»-r 
BBRSSS22205555 


eh oet 
^o^ du de Mo oM uS e 0 
ocoouocooocut 


name. 
-Soscan [4] 
meoune (60) 
Jmumber [5] 
-format arg [6] 
-angete [8] 
.memccpy [9] 
„Jain 12] 
.read [12] 
wéstr [10] 
.strlen [16] 
stmezp [17] 


105 ”断言 


在 软件 的 开发 过 程 中 ， 通 过 条 件 编译 引入 printf 调 用 等 调试 代码 的 
做 法 是 很 常见 的 ， 但 一 般 不 会 在 发 行 版 本 中 保留 这 些 信息 。 然 而 经 党 
会 出 现 这 样 的 情况 ， 程 序 运行 中 出 现 的 问题 与 不 正确 的 假设 有 关 而 并 
非 代码 的 错误 。 这 些 不 正确 的 假设 往往 是 被 主观 认为 不 会 发 生 的 事 
件 。 例 如 ， 人 们 在 编写 画 数 时 会 认为 它 的 输入 参数 应 该 位 于 一 个 确定 
的 范围 内 ， 但 万 一 给 它 传递 了 不 正确 的 数据 ， 就 可 能 造成 整个 系统 汉 
行 不 正常 。 

系统 的 内 部 逻辑 需要 被 确认 没有 错误 。 针 对 这 种 情况 ，X/Open 提 
供 了 assert 宏 ， 它 的 作用 是 测试 某 个 假设 是 否 成 立 ， 如 果 不 成 立 就 停止 
程序 的 运行 。 


#include «ass 


void (int expression) 


assert 宏 对 表达 式 进 行 求 值 ， 如 果 结 果 非 零 ， 它 就 往 标 准 错误 写 一 
些 诊 断 信 息 ， 然 后 调用 abort 函 数 结束 程序 的 运行 。 

头 文件 asserLh 定 义 的 宏 受 NDEBUG 的 影响 。 如 果 程 序 在 处 理 这 个 
头 文件 时 已 经 定义 了 NDEBUG， 束 不 定义 assert 宏 。 这 意味 着 ， 你 可 以 
在 编译 期 间 使 用 -DNDEBUG 关 闭 断 言 功 能 或 把 下 面 这 条 语句 : 


H o 

assert 安 的 这 种 用 法 市 来 一 个 问题 。 如 有 果 在 测试 阶段 使 用 assert， 
但 在 发 行 版 本 中 将 其 关闭 ， 那 你 的 发 行 版 本 代码 在 安全 检测 方面 束 比 
你 对 它 进行 测试 时 要 差 一 些 。 但 在 产品 代码 中 保留 assert 通 常 古 不 可 取 
的 一 一 难道 你 愿意 用 户 在 使 用 你 的 软件 时 在 屏幕 上 显示 一 条 不 友好 的 
assert failed 错 误 提 示 ， 然 后 束 退 出 程序 吗 ? 针对 这 个 问题 的 比较 好 的 
解决 方法 是 ， 编 写 目 己 的 错误 中 断 陷 阱 例 程 ， 在 该 例 程 中 进行 断言 ， 
但 不 需要 在 产品 代码 中 完全 禁用 该 功能 。 

你 还 必须 注意 不 要 让 assert 表 达 式 市 上 副作用 。 例 如 ， 如 果 使 用 了 
市 有 副作用 的 函数 调用 ， 这 个 副作用 在 删除 了 断言 功能 的 产品 代码 中 
谍 不 会 再 发 生 了 。 


加 到 每 个 源 文件 中 ， 但 这 条 语句 必须 放 在 #include <assert.h> 语 句 之 
j 


mr 
SC 验 assert 


F AXA ENF assert. EN T — T EHAX, "EH A BUD D s — T 1E 
数 。 它 用 断言 功能 来 保护 目 己 不 受 非法 参数 的 影响 。 

该 程序 首先 包 括 头 文件 asserLh， 然 后 定义 一 个 平方 根 男 数 ， 该 函 
数 检查 目 己 的 参数 是 否 为 正 数 ， 最 后 是 main 函 数 。 如 下 所 未: 


Sinclude «assert.! 


现在 ， 运 行 这 个 程序 时 ， 如 果 给 my _sqrt 函 数 传 递 了 一 个 非法 值 ， 
你 融会 看 到 一 个 断言 冲突 错误 。 错 误 信 息 的 格式 将 随 系统 的 不 同 而 不 
[E] e 


实验 解析 

当 我 们 试图 用 一 个 负数 来 调用 函数 my_sqrt 时 ， 断 言 失败 了 。 
assert 安 给 出 了 发 生 断 言 冲 突 的 文件 名 和 行 号 ， 还 给 出 了 失败 的 条 件 。 
程序 被 一 个 abort 中 断 陷阱 终止 了 运行 ， 这 束 是 assert 调 用 abort 的 结果 。 

如 果 用 -DNDEBUG 选 项 重新 编译 这 个 程序 ， 上 断言 功能 将 被 排除 在 
编译 结果 之 外 。 当 在 my_sqrt 函 数 中 调用 sqrt 函 数 时 ， 得 到 的 将 是 一 个 
NaN 值 (不 是 一 个 数字 ) ， 表 明 一 个 无 效 结果 ， 如 下 所 示 : 


CC -O assert -DNDEBUG assert.c -1m 
> .f/assert 


一 些 较 旧 的 数学 库 版 本 在 发 生 算术 错误 时 将 产生 一 个 异常 ， 程 序 
将 终止 并 返回 一 个 类 似 Floating point exception 的 消息 ， 而 不 是 返回 一 
个 NaN。 


10.6 ”内 存 调试 


动态 内 存 分 配 征 一 个 很 容易 出 现 程 序 漏洞 的 领域 ， 而 且 一 旦 漏洞 
出 现 ， 还 很 难 查 找 。 如 末 在 程序 中 用 malloc 和 free 函 数 来 分 配 内 存 ， 你 
束 必 须 清楚 目 己 分 配 过 的 每 一 块 内 存 ， 并 且 要 确定 没有 使 用 已 经 释放 
的 内 存 块 ， 这 一 点 非常 重要 。 

内 存 块 通 肖 都 症 由 malloc 函 数 分 配给 指针 变量 的 。 如 采 指 针 变 量 
的 取 值 发 生 了 变化 ， 义 没有 其 他 指针 指 疝 这 块 内 存 ， 这 块 内 存 束 变 得 
无 法 访问 。 这 融 是 一 种 内 存 泄 漏 现 象 ， 它 将 导致 程序 的 长 度 不 断 增 
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如 采 在 一 个 已 分 配 的 内 存 块 尾部 的 后 面 (或 在 它 头 部 的 前 面 ) 写 
数据 ， 束 很 可 能 会 损坏 malloc 库 用 于 记录 内 存 分 配 情况 的 数据 结构 。 
出 现 这 种 情况 后 ， 经 过 一 段 时 间 ， 一 个 malloc 调 用 ， 甚 至 是 一 个 free 调 
用 都 会 引发 段 错 误 并 导致 程序 骨 演 。 要 想 查 出 错误 发 生 的 准确 地 点 是 
E , AA TR T Bee TE S| ACRE BS LIE] SPI ZR A A E 


请 不 要 感到 惊讶 ， 目 前 已 经 有 可 以 帮助 解决 这 两 类 问题 的 工具 
了 ， 既 有 商业 版 本 的 也 有 人 免费 版 本 的 。malloc 和 free 函 数 也 有 许多 不 同 
的 版 本 ， 其 中 一 些 版 本 包含 了 额外 的 代码 ， 用 于 检查 内 存 分 配 和 内 存 
E 以 解决 诸如 一 个 内 存 块 被 释放 了 两 次 以 及 其 他 类 型 的 误 


10.6.1 ElectricFence KAUA 


ElectricFence EX Zi JÆ FH Bruce Perens 开 发 ， 在 一 些 Linux 发 行 版 如 
RedHat (企业 版 和 Fedora) 、SUSE 和 openSUSE 中 作为 可 选 组 件 出 
现 ， 在 因特网 上 也 很 容易 找到 。 它 党 试用 Linux 的 虚拟 内 存 机 制 来 保护 
malloc 和 free 所 使 用 的 内 存 ， 当 它 发 现 内 存 被 破坏 时 就 停止 程序 的 运 
行 。 


实 验 ElectricFence 
下 面 这 个 程序 efence.c 调 用 malloc 分 配 了 一 个 内 存 块 ， 然 后 在 这 个 
内 存 块 的 尾部 之 后 写 数据 。 我 们 来 看 看 将 发 生 什么 情况 。 


编译 并 运行 这 个 程序 时 ， 我 们 没有 看 到 任何 异常 现象 。 但 是 
可 能 已 遭受 一 定 程 度 的 破坏 ， 因此 我 们 迟早 
iit 


cC -O efence efence.c 
€ 


如 果 使 用 同一 个 程序 ， 但 将 它 与 ElectricFence 函 数 库 libefence.a 链 
接 起 来 ， 那 么 在 运行 这 个 程序 时 立刻 天 会 收 到 啊 应 ， 如 下 所 示 : 


cc "9 efence efence.c efence 
. /efence 


ie ui él s T UNUS 


cc -g 
gdb piney 


实验 解析 

ElectricFence 将 malloc 及 其 关联 函数 蔡 换 为 使 用 计算 机 处 理 絮 虚拟 
内 存 机 制 的 版 本 ， 从 而 你 护 系统 不 受 非法 内 存 访问 的 破坏 。 当 出 现 这 
类 的 非法 内 存 访问 时 ， 它 会 引发 一 个 段 冲 突 信 号 并 停止 程序 的 运行 。 


10.6.2 valgrind 


valgrind 是 一 个 工具 ， 它 有 能 力 检 测 出 前 面 讨论 过 的 许多 问题 。 特 
别 是 E 以 检测 出 数组 访问 错误 和 内 存 泄 漏 。 它 可 能 并 没有 包括 在 你 
的 Linux 发 行 版 中 ， 但 可 以 在 http://valgrind.org 上 找到 它 。 


程序 不 需要 重新 编译 瓯 可 以 使 用 valgrind， 甚 至 还 可 以 用 它 来 调试 
一 个 正在 运行 程序 的 内 存 访问 情况 。 这 个 工具 很 值得 一 试 ， 它 已 被 用 
在 大 型 软件 如 KDE 版 本 3 的 开发 中 。 


实 验 valgrind 
下 面 这 个 程序 checker.c 分 配 了 一 些 内 存 ， 然 后 从 2 ， 
z 在 分 配 内 存 尾部 之 后 写 数据 ， 最 后 将 该 内 存 区 域 变 
ails 


要 想 使 用 valgrind， 只 需 在 运行 valgrind 时 加 上 一 个 选项 告诉 它 我 
RREA, 然后 将 要 检查 的 程序 及 其 参数 (如 果 有 的 话 ) SEE 


”” 用 valgrind 运 行程 序 时 ， 我 们 将 看 到 它 诊 断 出 许多 问题 ， 如 下 所 
ZN: 


$ valgrind --leak-checkeyes -v ./checker 

==4780== Memcheck, a memory error detector. 

==4780e" Copyright (C) 2002-2007, and GNU GPL'd, by Julian Seward et al. 
-24780-- Using LibVEX rev 1732, a library fcr dynamic binary translation, 
-24780-- Copyright (C) 2004-2007, and GNU GPL'd, by OpenWorks LLP. 
-478ü-* Using valgrind-3.2.3, a dynamic binary instrumentation framework. 
==4780== Copyright [IC 2000-2007, and GNU GPL'd, by Julian Seward et al. 
294760e2 

--4780-- Command line 


--4780-- ,/checker 
*-47B0-- Startup, with flags: 
-$780-- --leak-checksyes 
--4782-- -4 


--$780-- Contents of /proc/version: 

-:4780-- linux version 2,£.20.2-2-default [geekoSbuildhost] (gcc version 4.1.3 
20070218 (prerelease) {SUSE Linux)) $1 SMP Fri Mar 9 21:54:10 UTC 2007 

--47B80-- Arch and hwcops: X86, xB6-ssel-sse2 

--4780-- Page sizes: currently 4094, max supported 4036 

-—4780-- Valgrind library directory: /usr/lib/valgrind 

--$780-- Reading syma from /lib/ld-2.5..0 [0x4000000) 

-.4780-- Reading syms from /home/neil/BLP4e/chapteriO/checker (0x8048000] 

-*4$780-- Reading syms from /uar/lib/wvalgrind/x86-linux/memcheck |0x38000000] 

--4780-- object doesn't have «a symbol table 

-.6780-- object doesn't have a dynamic symbcl table 

--4780-- Reading suppressions file: /usr/lib/valgrind/default.supp 

--4780-- REDIR; 0x4015880 [index) redirected to 0x38027EDB (77?) 

--47B0-- Reading syms from /usr/lib/valgrind/x86-linux/vgpreload core.so 
(0x491E000] 

-4780-- object doesn't have a symbol rabie 

—4780-- Reading syms from /usr/lib/valgrind/x86-linux;/vgprelocad memcheck.sc 
10x4021000] 

4780-- object doesn't have a symbol table 

==4780== WARNING: new redirection conflicts with existing -- ignoring it 

--4780~- new: 0x04015880 (index ] R-» 0x04024490 index 

-4780-- REDIR: D0x4015AS0 |strlen) redirected to 0x4024540 (strlen) 

-24780-- Reading syru from /lib/libc-2.5.50 [0x40430001 

--4380-- REDIR: Ox40ADPFO |rindex)| redirected to 0x4024370 Irindexi 

--4780-- REDIR: 0x40AAFQ0 [malloc) redirected to 0x4023700 (malloc) 

-24780-- Invalid read of size 1 


mngT8Dew at ÜxPO4842C- main (checker.c:10j 

*-"4iB8Ü«* Address 0x4170423 is 0 bytes after a block of size 1.024 alloc'd 
*54180«« at 0x402276S: malloc [in /ust/lib/velgrind/x8Só- 
linux/vgpreload memcheck.a0) 

2547802» by 0x8048420: main [checker.c:&) 

zz478022 

x-24780-» Invalic write cf size I 

247802» at Ox804B43A: main (checker.c:i3] 

-2$780-» Address 0x41704128 is O bytes after a block of size 1,024 alloc'd 
SLA RA: CEES at 0x4023785: malloc [in /usp/lib/valgrind/x@t- 
linux/vgpreload,memcheck. 80) 

23478052 by Üx8O48420: main ichecker.c:ó] 

--4780-- REDIR: Üx40ABBBO (free) redirected to 0CX402331A |ftee; 

--4780-- REDIR: OX40AEE70 imemset| redirected to 0x40268A0 (memset! 
z3478025 

z247B0:» ERROR SUMMARY: 2 errors from 2 contexts (suppressed: ) from $) 
-54780** 

*-54780*» I errors in context 1 of 2: 

-4780*» Invalid write of size 1 

be at 0x804543A: main [checker.c:13| 

»547802»  Addrezz 0x4170428 is 0 bytes after a block of size 1,024 alloc'd 
z2478022 at 0x4023785- mallos lin /usr/lib/valgrind/xB6&- 


limuxivgpreload mamcheck. so) 
=26780== by 0x8048420: main (checker.c:4) 
22878023 


547802» 1 errors in context 2 of 2: 

**4780** Invalid read of size 1 

*«$780«* at 0xBO4B4IC: main lchecker.c:10) 

-"4T7B0*- Addresu 0x4170424 is 0 bytes after a block of aise 1,024 alloc'd 
22478023 at 0x4023785; malloc (in /usr/lib/valgrind/x8Bé- 
linux/vgprelcad memcheck.s3] 

2247805» by 0x$046420: main (checker.crf) 

224780- 

*-4$180-- supp: 3 di-hack3 

»^4780«* 

-14780*»» IN SUMMARY: 2 errors from 2 contexts imuppressed: 3 from 1j 
2348780-- 

-24780:» malloc/free: in use at exit: 1,024 bytes in | blocks. 
*^4780** malloc/free: i allocg, D frees, 1,024 bytes allocated. 
124078054 

-»2$780s» searching for pointers to 1 not-freoed bioces, 

147807» checked 65,444 bytes. 

2247802» 

#678008 

#«$780e= 1,024 bytes in 1 blocks are definitely lost in loss record 1 of 1 
2247802» at 0x402J785: malloc lin /usr/lib/valgrind/x86- 
linux/vgpreload memcheck.s0) 

2247802» by 0x8048420: main (checker.c:6) 

ww 7B0ee 

*-4780*» LEAK SUMMARY: i 

22478022 definitely lost: 1.026 bytes in i blocks. 

CE possibly lost: 0 bytes in 9 blocks. 

2247802» still reachable: 0 bytes in 6 blocks. 

22478019 suppressed: 0 bytes in 0 blocks, 


我 们 看 到 它 查 出 了 错误 的 读 写 操作 ， 同 时 还 给 出 了 与 之 对 应 的 内 
存 块 及 其 分 配 位 置 。 我 们 可 以 用 调试 名 在 错误 地 点 中 断 程序 的 运行 。 

valgrind 有 许多 选项 ， 包 括 对 特定 类 型 错误 的 抑制 和 内 存 泄漏 的 检 
测 。 要 想 检 测 程序 的 内 存 泄 漏 问题 ， 我 们 必须 使 用 valgrind 的 一 个 选 
项 。 如 有 果 想 在 程序 运行 结束 时 进行 内 存 泄漏 的 检查 ， 需 要 指定 选项 -- 
leak-check=yes。 我 们 可 以 用 命令 valgrind --help 获 得 完整 的 选项 列表 。 

实验 解析 

我 们 的 程序 在 valgrind 的 控制 下 执行 ， 它 中 途 截获 程序 执行 的 各 种 
操作 并 进行 许多 检查 工作 ， 包 括 内 存 访问 的 检查 。 如 采 该 访问 操作 涉 
及 一 个 已 分 配 的 内 存 块 并 且 是 非法 的 访问 ，valgrind 将 打印 出 消 轧 。 在 
程序 执行 结束 时 ， 它 将 运行 一 个 垃圾 收集 例 程 来 检测 是 否 有 已 分 配 的 
内 存 块 示 被 释放 。 如 有 果 有 ， 它 将 报告 这 些 被 遗弃 的 内 存 块 。 


10.7 ”小结 


在 本 章 中 我 们 介绍 了 一 些 调试 工具 和 技巧 。Linux 提 供 了 一 些 功能 
强大 的 工具 帮助 我 们 修复 程序 中 的 漏洞 。 我 们 用 gdb 消 除了 示例 程序 中 
的 漏洞 ， 并 介绍 了 一 些 静 态 分 析 工 具 ， 如 cflow 和 splint。 最 后 ， 我 们 对 
使 用 动态 内 存 分 配 可 能 出 现 的 问题 进行 了 讨论 ， 并 介绍 了 一 些 可 以 帮 
助 我 们 诊断 它们 的 工具 ， 如 ElectricFence 和 valgrind. 

在 本 章 中 讨论 的 大 多 数 工具 都 可 以 在 因特网 上 的 FIP 服务器 中 找 
到 。 我 们 关心 的 是 在 某 些 情况 下 需要 注意 保留 版 权 信 息 。 其 中 许多 工 
具 的 信息 都 取 上 自 Linux 档 案 网 站 http://www.ibiblio.org/pub/Linux. 我 们 项 
望 最 新 发 布 的 版 本 也 可 以 在 该 网 址 找到 。 


11 进程 和 信 


进程 和 信号 构成 了 Linux 操 作 环境 的 基础 部 分 e 它们 控制 着 
Linux 和 所 有 其 他 类 UNIX 计 算 机 系统 执行 的 几乎 所 有 活动 。 不 管 是 对 
于 系统 程序 员 、 应 用 程序 员 还 是 系统 管理 者 ， 理 解 Linux 和 UNIX 系 统 
的 进程 管理 都 是 很 有 好 处 的 。 

在 本 章 中 ， 我 们 将 看 到 Linux 环 境 中 的 进程 是 如 何 被 管理 的 ， 怎 样 
才能 知道 计算 机 在 任 一 给 定时 刻 在 做 些 什 么 。 我 们 还 将 介绍 如 何 才能 
在 自己 的 程序 中 启动 和 停止 其 他 的 进程 ， 如 何 让 进程 收发 消息 ， 如 何 
避免 僵尸 进程 等 内 容 。 有 具体 地 ， 我 们 将 介绍 以 下 几 方 面 的 内 容 : 

O ”进程 的 结构 、 类 型 和 调度 

o 用 不 同 的 方法 启动 新 进程 

口 、 父 进程 、 子 进程 和 伪 尸 进程 

o 什么 是 信号 以 及 如 何 使 用 它们 


11.1 什么 是 进程 


UNIX 标 准 (特别 是 IEEE Std 1003. 1,,2004 年 版 ) 把 进程 定义 
为 :“ 一 个 其 中 运行 着 一 个 或 多 个 线程 的 地 址 空间 和 这 些 线程 所 需要 的 
系统 资源 。” 我 们 将 在 第 12 章 介绍 线程 。 目 前 ， 可 以 把 进程 看 作 正 在 运 
行 的 程序 。 

像 Linux 这 样 的 多 任务 操作 系统 可 以 同时 运行 多 个 程序 。 每 个 运行 
着 的 程序 实例 就 构成 一 个 进程 。 在 X 视 窗 系统 (通常 简称 为 X) 等 视窗 
化 系统 中 这 一 特点 尤为 明显 。 如 同 微软 的 Windows 系 统 ，X 视 窗 系统 提 
供 了 一 个 图 形 化 的 用 户 界面 ， 它 允许 同时 运行 多 个 应 用 程序 ， 每 个 应 
用 程序 可 以 在 一 个 或 多 个 窗口 中 显示 。 

作为 多 用 户 系统 ，Linux 人 允许 许多 用 户 同时 访问 系统 。 每 个 用 户 可 
以 同时 运行 许多 个 程序 ， 其 至 同时 运行 同一 个 程序 的 许多 个 实例 。 系 
统 本 身 也 运行 着 一 些 管理 系统 资源 和 控制 用 户 访问 的 程序 。 

正如 我 们 在 第 4 章 看 到 的 ， 正 在 运行 的 程序 或 进程 由 程序 代码 、 数 
据 、 变 量 (占用 着 系统 内 存 ) 、 打 开 的 文件 〈 文 件 描述 符 ) 和 环境 组 
成 。 一 般 来 说 ，Linux 系 统 会 在 进程 之 间 共 享 程序 代码 和 系统 函数 库 ， 
所 以 在 任何 时 刻 内 存 中 都 只 有 代码 的 一 份 副本 。 


11.2 veer 


r 


我 们 来 看 看 操作 系统 十 


p 


们 使 用 的 进程 如 图 11-1 所 示 。 


neil 


$ grep kirk trek.txt 


UIA BS AEH » WRA TS HH neil 


和 rick， 他 们 同时 运行 grep 程 序 在 不 同 的 文件 中 查找 不 同 的 子 符 串 。 他 


rick 
$ grep troi nextgen.doc 


PID 102 


PID 101 
Ra oroek — 代码 
数据 iu ”数据 | 
s = “kirk S — "troi" | 
函数 库 PCH A ABIES 函数 库 | 
文件 | xf 
| | 
trek.txt nextgen;doc 
图 11-1 


人 
f: 


每 个 进程 都 会 被 分 配 一 个 唯一 的 数字 编号 ， 我 们 称 之 为 进程 标识 
符 或 PID. 它 通常 是 一 个 取 值 范围 从 2 到 32768 的 正 整数 。 当 进程 被 启动 
时 ， 系 统 将 按 顺序 选择 下 一 个 未 被 使 用 的 数字 作为 它 的 PID, 当 数字 已 
经 回 绕 一 圈 时 ， 新 的 PID 重 新 从 2 开始 。 数 字 1 一 般 是 为 特殊 进程 init 保 
留 的 ，init 进 程 负 责 管理 其 他 进程 ， 我 们 很 快 就 会 再 次 谈 到 它 。 这 里 我 
们 可 以 看 到 由 用 户 neil 和 rick 启 动 的 两 个 进程 被 分 配 的 PID 分 别 是 101 和 
102 。 

将 要 被 grep 命 令 执行 的 程序 代码 被 保存 在 一 个 磁盘 文件 中 。 正 篆 
情况 下 ，Linux 进 程 不 能 对 用 来 存放 程序 代码 的 内 存 区 域 进 行 写 操作 ， 
即 程序 代码 是 以 只 读 方 式 加 载 到 内 存 中 的 。 我 们 从 图 11-1 中 可 以 看 


到 ,虽然 不 能 对 这 个 区 域 执行 写 操作 ， 但 它 可 以 被 多 个 进程 安全 地 共 


EX 

ASH BUS n] BES ^ HIM, STEPH ZIP MEISE 
ZYH printf KA, AEP RR EAI 7 0) BARBY n] o MIE S MER 
WindowsERTE Z 5H [2 HYEN aS Be E (DLL) 机制 类 似 ， 但 更 加 复 


Žu o 

A EBdrpixeup DUE. RS RRNA MERE, Ba 
TAT FEF grep BJ f£ 2: FA BIR), ANE RAGES HME 
码 。 这 对 一 个 单独 的 程序 来 说 ， 算 不 上 大 优点 ， 但 对 整个 操作 系统 来 
说 ， 把 常用 例 程 提 取出 来 放 入 (比如 说 ) C 语 言 的 标准 函数 库 中 将 节 
AK BNE [R] o 

当然 ， 并 不 是 程序 在 运行 时 所 需要 的 所 有 东西 都 可 以 被 共享 。 例 
如 ， 进 程 使 用 的 变量 就 与 其 他 进程 所 使 用 的 截然 不 同 。 在 本 例 中 ， 传 
递 给 grep 程 序 的 搜索 字符 串 以 变量 s 的 形式 出 现在 每 个 进程 的 数据 区 
中 。 它 们 之 间 是 分 离 的 ， 通 常 不 能 被 其 他 进程 读 取 。 这 两 个 grep 命 令 
所 使 用 的 文件 也 各 不 相同 ， 进 程 通过 各 目的 文件 描述 符 来 访问 文件 。 

除 此 之 外 ， 进 程 有 目 己 的 栈 空 间 ， 用 于 保存 函数 中 的 局 部 变量 和 
控制 本 数 的 调用 与 返回 。 进 程 还 有 目 己 的 环境 空间 ， 包 含 专门 为 这 个 
进程 建立 的 环境 变量 ， 我 们 在 第 4 章 介 绍 putenv 和 getenv 函 数 时 已 用 过 
这 些 环境 变量 。 进 程 还 必须 维护 目 己 的 程序 计数 锅 ， 这 个 计数 规 用 来 
记录 它 执行 到 的 位 置 ， 即 在 执行 线程 中 的 位 置 。 我 们 将 在 下 一 章 看 
到 ， 在 使 用 线程 时 ， 进 程 可 以 有 不 止 一 个 执行 线程 。 

在 许多 Linux 系 统 〈 也 包括 一 些 UNIX 系 统 ) 上 ， 在 目录 /proc 中 有 
一 组 特殊 的 文件 ， 这 些 文件 的 特殊 之 处 在 于 它们 允许 你 “ 舌 视 * 正 在 运 
行 的 进程 的 内 部 情况 ， 束 好 像 这 些 进程 是 目 孙 中 的 文件 一 样 。 我 们 在 
第 3 草 已 简单 介绍 过 /proc 文 件 系统 了 。 

最 后 ， 因 为 Linux 和 UNIX 一 样 ， 有 一 个 虚拟 内 存 系统 ， 能 够 把 程 
序 代 码 和 数据 以 内 存 页 面 的 形式 放 到 硬盘 的 一 个 区 域 中 ， 所 以 Linux 可 
以 管理 的 进程 比 物理 内 存 所 能 容纳 的 要 多 得 多 。 


11.2.1 “进程 


Linux 进 程 表 束 像 一 个 数据 结构 ， 它 把 当前 加 载 在 内 存 中 的 所 有 进 
程 的 有 关 信 息 保 存在 一 个 表 中 ， 其 中 包括 进程 的 PID、 进 程 的 状态 、 
命令 字符 串 和 其 他 一 些 ps 命令 输出 的 各 类 信息 。 操 作 系 统 通 过 进程 的 
PID 对 它们 进行 管理 ， 这 些 PID 是 进程 表 的 索引 。 进 程 表 的 长 度 是 有 限 
制 的， 所 以 系统 能 够 文 持 的 同时 运行 的 进程 数 也 是 有 限制 的 。 早 期 的 


UNIX 系 统 只 能 同时 运行 256 个 进程 。 最 新 的 实现 版 本 已 大 幅度 放 视 这 
一 限制 ， 可 以 同时 运行 的 进程 数 可 能 只 与 用 于 建立 进程 表 项 的 内 存 容 
量 有 关 ， 而 没有 具体 的 数字 限制 了 。 


11.2.2 ”查看 进程 


ps 命令 可 以 显示 我 们 正在 运行 的 进程 、 其 他 用 户 正 在 运行 的 进程 
或 者 目前 在 系统 上 运行 的 所 有 进程 。 下 面 是 ps 命令 的 输出 样本 : 


ps -ef 


这 个 命令 显示 了 许多 进程 的 相关 信息 ， 包 括 在 X 视 窗 系统 中 运行 
的 Emacs 编辑 毁 。 例 如 ，TITY 一 列 显示 了 进程 是 从 哪 一 个 终端 局 动 
的 ，TIME 一 列 是 进程 目前 为 止 所 占用 的 CPU 时 间 ，CMD 一 列 显示 局 
动 进 程 所 使 用 的 命令 。 下 面 我 们 来 仔细 查看 其 中 的 一 些 进程 信息 。 

neil 655 428 0 18:24 tty4 00:00:00 -bash 

用 户 的 初始 登录 是 在 第 4 个 虚拟 终端 完成 的 。 该 终端 征 这 合 机 器 的 
一 个 主 控 台 。 运 行 的 shell 程 序 是 Linux 系 统 的 默认 shell: bash. 

root 467 433 0 18:12 ttyl 00:00:00 sh /usr/XIIR6/bin/startx 

XX 视窗 系统 是 由 命令 startx 启 动 的 。 该 命令 是 一 个 shell 脚 本 ， 它 启 
动 X 服 务 絮 并 运行 一 些 初始 化 X 视 窗 系 统 的 程序 。 

root 717 716 13 18:28 pts/0 00:00:01 emacs 

这 个 进程 代表 着 X 视 窗 系统 中 一 个 运行 着 Emacs 编 辑 磊 的 窗口 。 它 
是 由 窗口 管理 器 响应 一 个 创建 新 窗口 的 请 求 而 启动 的 。 系 统 还 分 配给 
shell 一 个 新 的 伪 终 端 pts/0,shell 可 以 通过 该 终端 进行 读 写 操作 。 

root 512 1 0 18:12 ttyl 00:00:01 gnome-help-browser --sm-client-i 

这 是 由 窗口 管理 器 启动 的 GNOME 帮 助 信 息 浏 览 器 。 
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持 连 接 的 进程 的 信息 。 其 他 进程 在 运行 时 不 需要 通过 终端 与 用 户 进行 
通信 ， 它们 通常 都 是 一 些 系 统 进 程 ，Linux 用 它们 来 管理 共享 的 资源 。 
我 们 可 以 用 ps 命 心 的 -a 选项 查看 所 有 的 进程 ， 用 -f 移 项 显示 进程 完整 的 


o 
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ps 命令 的 精确 语法 及 其 输出 内 容 的 格式 随 系统 的 不 同 而 稍 有 
变化 。Linux 使 用 的 GNU 版 本 的 ps 命令 支持 来 自 以 前 几 个 ps 命令 实 
现 版 本 中 的 选项 (包括 来 自 UNIX 变 体 BSD 和 AT&T 中 ps 命令 的 选 
项 ) ， 并 且 它 还 新 增 了 一 些 选项 。 有 关 ps 命 令 可 使 用 的 选项 和 输 
出 格式 的 更 多 细节 请 参考 其 手册 。 


11.2.3 ”系统 进程 


下 面 显示 的 是 运行 在 另 一 台 Linux 系 统 上 的 一 些 进程 。 为 清楚 起 
见 ， 我 们 对 输出 结 采 进行 了 位 化 。 在 下 面 的 例子 中 ， 你 将 看 到 如 何 查 
看 进程 的 状态 。ps 命 令 输 出 中 的 STAT 一 列 用 来 表明 进程 的 当前 状态 。 
常见 的 STAT 代 码 见 表 11-1。 其 中 一 些 代 码 的 含义 将 随 着 本 章 后 面 的 介 
绍 变 得 更 加 清晰 ， 而 男 一 些 代 码 则 超出 了 本 书 介绍 的 范围 ， 你 可 以 安 
全 地 忽略 它们 。 


表 11-1 


STATE 


v3 


我 们 在 这 里 看 到 了 一 个 非常 重要 的 进程 。 

1 ? Ss 0:03 init [5] 

TRIS, BET ERE EB ee EHI PB DER A SC EE FB 9] 
的 ， 被 父 进 程 启动 的 进程 叫做 子 进程 。Linux 系 统 启动 时 ， 它 将 运行 一 
个 名 为 init 的 进程 ， 该 进程 是 系统 运行 的 第 一 个 进程 ， 它 的 进程 号 为 
1 ° 你 可 以 把 init 进 程 看 作为 操作 系统 的 进程 管理 器 ， 它 是 其 他 所 有 进 
程 的 祖先 进程 。 我 们 将 要 看 到 的 其 他 系统 进程 要 么 是 由 init 进 程 启动 
的 ， 要 么 是 由 被 init 进 程 启 动 的 其 他 进程 局 动 的 。 

用 户 登 录 的 处 理 过 程 束 是 一 个 这 样 的 例子 。init 埋 程 为 每 个 用 户 用 
来 登 示 的 串 行 终端 或 拨号 调制 解 调 融 局 动 一 次 getty 程 序 。 对 应 的 ps 命 
令 输出 如 下 所 示 : 

9619 tty2 Ss+ 0:00 /sbin/mingetty tty2 

getty 进 程 等 等 来 目 终端 的 操作 ， 辣 用 尸 显示 熟悉 的 登录 提示 符 ， 
然后 把 控制 移交 给 登录 程序 ， 登 录 程 序 设置 用 户 环境 ， 最 后 局 动 一 个 
shell。 用 户 退 出 系统 时 ，init 进 程 将 再 次 局 动 男 一 个 getty 进 程 。 


局 动 新 进程 并 等 竺 它们 结束 的 能 力 是 整个 系统 的 基础 。 我 们 将 在 


本 章 的 后 面 看 到 如 何 从 上 自己 的 程序 中 用 系统 调用 fork、exec 和 wait 来 完 
成 同样 的 任务 。 


ps 命令 的 输出 结果 中 还 有 一 条 对 应 ps 命令 本 吴 的 记录 : 

21475 pts/2 R+ 0:00 ps ax 

这 行 表明 进程 21475 处 于 运行 状态 (R) ， 正 在 执行 的 命令 是 ps 
ax。 也 就 是 说 ， 这 个 进程 出 现在 自己 的 输出 结果 中 了 。 这 个 状态 指示 
符 只 表示 程序 已 准备 好 运行 ， 并 不 意味 着 它 正 在 运行 。 在 一 台 单 处 理 
需 计 算 机 上 ， 同 一 时 间 只 能 有 一 个 进程 可 以 运行 ， 其 他 进程 处 于 等 行 
运行 状态 。 每 个 进程 轮 到 的 运行 时 间 《我 们 称 之 为 时 间 搬 ) 是 相当 短 
暂 的 ， 这 惑 给 人 一 种 多 个 程序 在 同时 运行 的 假象 。 状 态 R+ 只 表示 这 个 
程序 是 一 个 前 人 台 任 务 ， 它 不 是 在 等 待 其 他 进程 结束 或 等 待 输入 输出 操 
作 完 成 。 这 就 古 为 什么 你 可 能 会 在 ps 命令 的 输出 结果 中 看 到 两 个 这 样 
NE ee Ea 
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程 。 它 的 判断 依据 是 进程 的 优先 级 (我们 在 第 4 章 已 讨论 过 优先 级 的 概 
A) 。 优 先 级 高 的 进程 运行 得 更 为 频繁 。 而 其 他 进程 ， 如 低 优 先 级 的 
后 台 任 务 运行 的 惑 不 是 非常 频 烷 。 在 Linux 中 ， 进 程 的 运行 时 间 不 可 能 
超过 分 配给 它们 的 时 间 片 ， 它 们 采用 的 古 抢先 式 多 任务 处 理 ， 所 以 进 
程 的 挂 起 和 继续 运行 无 需 彼此 之 间 的 协作 。 但 早 一 些 的 系统 ， 如 微软 
DW oer Ue 
继续 运行 。 

在 一 个 如 Linux 这 样 的 多 任务 系统 中 ， 多 个 程序 可 能 会 竞争 使 用 同 
一 个 货源 。 在 这 种 情况 下 ， 执 行 短 期 的 突 发 性 工作 并 暂 俘 运 行 来 等 行 
输入 的 程序 ， 要 比 持续 占用 处 理 器 来 进行 计算 或 不 断 轮 询 系 统 来 查看 
古 否 有 新 的 输入 到 达 的 程序 要 更 好 。 我 们 称 表现 民 好 的 程序 为 nice 程 
序 ， 而 且 在 某 种 意义 上 ， 这 个 nice 是 可 以 被 计算 出 来 的 。 操 作 系 统 根 
据 进程 的 nice 值 来 决定 它 的 优先 级 ， 一 个 进程 的 nice 值 默认 为 0 并 将 根 
据 这 个 程序 的 表现 而 不 断 变 化 。 长 期 不 间断 运行 的 程序 的 优先 级 一 般 
会 比较 低 。 而 (例如 ) 暂停 来 等 待 输入 的 程序 会 得 到 奖励 。 这 可 以 帮 
助 与 用 户 进行 交互 的 程序 保持 及 时 的 啊 应 性 。 在 程序 等 竺 用 户 的 输入 
时 ， 系 统 会 增加 它 的 优先 级 ， 这 样 ， 当 它 准 备 继续 运行 时 ， 它 束 会 有 
比较 高 的 优先 级 而 能 优先 执行 。 我 们 可 以 用 nice 命 令 设置 进程 的 nice 


值 ， 使 用 renice 命 令 调 整 它 的 值 。nice 命 令 是 将 进程 的 nice 值 增加 10， 
从 而 降低 该 进程 的 优先 级 。 我 们 可 以 用 ps 命令 的 -1 或 -f (长 格式 输出 ) 
a "我 们 感 兴趣 的 值 列 在 NI (nice) 一 
兰 ， 如 下 所 示 : 


ps -1 


我 们 看 到 oclock 程 序 〈 进 程 号 为 1362) 正在 以 默认 的 nice 值 运行 。 
如 果 我 们 用 下 面 的 命令 来 启动 它 : 

$nice oclock & 
它 将 分 配 到 一 个 +10 的 nice 值 。 如 果 用 下 面 的 命令 调整 这 个 值 : 

$renice 10 1362 

1362: old priority 0, new priority 10 
这 个 时 钟 程序 运行 得 就 会 不 那么 频繁 了 。 我 们 可 以 再 用 ps 命令 查看 修 
改过 的 nice 值 ， 如 下 所 示 : 


$ ps -1 


状态 栏 STAT 中 包含 字符 N 表 明 这 个 进程 的 nice 值 已 被 修改 过 ， 已 
经 不 是 默认 值 了 。 


ps 命令 输出 中 的 PPID 栏 给 出 的 是 父 进程 的 进程 ID ， 它 是 启动 这 个 
进程 的 进程 的 PID. 如 果 原 来 的 父 进程 已 经 不 存在 ， 该 栏 显 示 的 就 是 init 
进程 的 进程 ID (PID 为 1) . 

Linux 调 度 器 根据 进程 的 优先 级 来 决定 运行 哪个 进程 。 每 个 系统 的 
具体 实现 各 有 不 同 ， 但 高 优先 级 的 进程 总 是 运行 得 更 频繁 。 某 些 情况 
下 ， 只 要 还 有 高 优先 级 的 进程 可 以 运行 ， 低 优先 级 的 进程 就 根本 不 能 


11.3 ”启动 新 进程 


tul e 从 而 创建 一 个 新 进 
程 。 这 个 工作 可 以 通过 库 函 数 system 来 完成 。 


finclude <stdlib.h> 


int system (const char *string); 


system 画 数 的 作用 是 ， 运 行 以 字 答 串 参 数 的 形式 传递 给 它 的 命令 
等 待 该 命令 的 完成 。 命 令 的 执行 情况 就 如 同 在 shell 中 执行 如 下 的 命 


$sh -c string 
如 果 无 法 启动 shell 来 运行 这 个 命令 ，system 函 数 将 返回 错误 代码 127; 如 
a 则 返回 -1。 和 否则 system Ex BUR 3 ENZ ais S AI HH 
fi 


X 验 system 
E Akma — T RI, Ik ESET pst ° B 
个 程序 本 身 的 用 处 不 是 很 大 ， BRIDE ERR e eha jx 
AUR RR ° 为 了 简单 ， 我 们 在 这 个 例子 中 也 没有 检查 system 调 
用 是 否 能 够 真正 的 工作 。 


nrintfi*Done.in* 


编译 并 运行 这 个 程序 system1.c 时 ， 将 看 到 如 下 所 示 的 输出 : 


./systenl 


因为 system 函 数 用 一 个 shell 来 启动 想 要 执行 的 程序 ， 所 以 可 以 把 
EL ay o 具体 做 法 是 将 systeml.c 中 的 函数 调用 修改 为 
sce 


编译 并 运行 这 个 痢 版 本 的 程序 时 ， 我 们 将 看 到 ; 


$ ./asystem2 


实验 解析 

在 第 一 个 例子 中 ， 程 序 以 字符 串 “ps ax” HARO Hl system ES 230. 
而 在 程序 中 执行 ps 命令 。 我 们 的 程序 在 ps 命令 完成 后 从 system 调 用 中 
返回 。system 函 数 很 有 用 ， 但 它 也 有 局 限 性 ， 因 为 程序 必须 等 竺 
因此 我 们 不 能 立刻 执行 其 

& o 

TE BP PIF P, X system ER Z2 A Val FEE shell 4 £& OR Ja S£ Zl 
返回 。 由 于 它 是 一 个 在 后 台 运 行程 序 的 请 求 ， 所 以 ps 程序 一 启动 shell 
we 这 与 我 们 在 shell 提 示 符 下 执行 下 面 这 条 命令 的 效果 是 一 样 


$ps ax& 

在 ps 命令 还 未 来 得 及 打印 出 它 的 所 有 输出 结果 之 前 ，system2 程 序 
瓯 打印 出 字符 串 Done 然 后 退出 了 。 在 system2 程 序 退 出 后 ，ps 命 令 继续 
完成 它 的 输出 。 这 类 的 处 理 行为 往往 会 给 用 户 带 来 很 大 的 困惑 。 如 果 
想 要 用 好 进程 ， 我 们 就 需要 能 够 对 它们 的 行为 做 更 细致 的 控制 。 下 面 
来 看 一 个 用 来 创建 进程 的 底层 接口 exec. 


一 般 来 说 ， 使 用 system 夯 数 远 非 启 动 。 其 他 进程 的 理想 手 
段 ， 因 为 它 必须 用 一 个 shell 米 启动 需要 的 程序 。 由 于 在 启动 程序 
之 前 需要 先 启动 一 个 shell， 而 且 对 shell 的 安装 情况 及 使 用 的 环境 
的 依赖 也 很 大 ， 所 以 使 用 system 函 数 的 效率 不 高 。 在 下 一 节 中 ， 
我 们 将 看 到 一 种 更 好 的 调用 程序 的 方法 ， 与 system 调 用 相 比 ， 我 
们 应 该 总 是 在 程序 中 优先 使 用 这 种 方法 。 


1. 替换 进程 映像 


exec 系 列 函 数 由 一 组 相关 的 函数 组 成 ， 它 们 在 进程 的 启动 方式 和 
程序 参数 的 表达 方式 上 各 有 不 同 。exec 函 数 可 以 把 当前 进程 替换 为 一 
个 新 进程 ， 新 进程 由 path 或 外 e 参 数 指定 。 你 可 以 使 用 exec 函 数 将 程序 
的 执行 从 一 个 程序 切换 到 男 一 个 程序 。 例 如 ， 你 可 以 在 启动 男 一 个 有 
着 受 限 使 用 策略 的 程序 前 ， 检 查 用 户 的 竹 证 。exec 范 数 比 system 范 数 
更 有 效 ， 因 为 在 新 的 程序 启动 后 ， 原 来 的 程序 天 不 再 运行 了 。 


#include <unistd.h> 


char **e 

int execl(const char *path, const char *argÜ0, ..., (char *)0); 

int execlp(const char *file, const char *argO0, ..., (char *)0) 

int execle(const char *path, const char *arg0, ..., (char *]0, char *const 


envp[1):; 

nt execv(const char *path, char *const argv[)); 

nt execvp(const char ‘file, char *const argv([]1); 

nt execve(const char *path, char *const argv[], char *const envp[]); 


这 些 函 数 可 以 分 为 两 大 类 。execl、execlp 和 execle 的 参数 个 数 是 可 
变 的 ， 参 数 以 一 个 空 指针 结束 。execv 和 execvp 的 第 二 个 参数 是 一 个 字 
符 串 数组 。 不 管 是 哪 种 情况 ， 新 程序 在 启动 时 会 把 在 argv 数 组 中 给 定 
的 参数 传递 给 main 画 数 。 

这 些 函 数 通常 都 是 用 execve 实 现 的 ， 虽 然 并 不 是 必须 要 这 样 做 。 

以 字母 p 结 尾 的 函数 通过 搜索 PATH 环境 变量 来 查找 新 程序 的 可 执 
行文 件 的 路 径 。 如 果 可 执行 文件 不 在 PATH 定义 的 路 径 中 ， 我 们 天 需要 
把 包括 目录 在 内 的 使 用 绝对 路 径 的 文件 名 作为 参数 传递 给 函数 。 

全 局 变量 environ 可 用 来 把 一 个 值 传递 到 新 的 程序 环境 中 。 此 外 ， 
函数 execle 和 execve 可 以 通过 参数 envp 传 递 字 符 串 数组 作为 新 程序 的 环 
境 变量 。 

如 采 想 通过 exec 函 数 来 启动 ps 程序 ， 我 们 可 以 从 6 个 exec 国 数 中 选 
择 一 个 ， 如 下 面 的 代码 片段 所 示 : 


i 
i 
i 


验 execlp Wal 
修改 示例 程序 ， 使 用 execlp 范 数 调用 : 


将 


运行 这 个 程序 时 ， 你 会 看 到 正常 的 ps 输出 ， 但 字符 串 Done 却 根本 
没有 出 现 。 另外 值得 注意 的 是 ， ps 的 输出 中 没有 pexec 进 程 的 任何 信 


. /pexec 


实验 解析 

程序 先 打 印 出 它 的 第 一 条 消息 ， 接 着 调用 execlp ， 这 个 函数 在 
PATH 环境 变量 给 出 的 目录 中 搜索 程序 ps。 然 后 用 这 个 程序 替换 pexec 
程序 ， 束 好 像 和 直接 使 用 如 下 所 示 的 shell 命 令 一 样 : 

$ps ax 

ps 命令 结束 时 ， 我 们 看 到 一 个 新 的 shell 提 示 符 ， 因 为 我 们 并 没有 
再 返回 到 pexec 程 序 中 ， 所 以 第 二 条 消息 是 不 会 打印 出 来 的 。 新 进程 的 
PID、PPID 和 nice 值 与 原先 的 完全 一 样 。 事 实 上， 这 里 发 生 的 一 切 其 
运行 中 的 程序 开始 执行 exec 调 用 中 指定 的 新 的 可 执行 文件 中 

对 于 由 exec 函 数 启动 的 进程 来 说 ， 它 的 参数 表 和 环境 加 在 一 起 的 
总 长 度 是 有 限制 的 。 上 限 由 ARG_MAX 给 出 ， 在 Linux 系 统 上 它 是 
128K 字 有 。 其 他 系统 可 能 会 设置 一 个 非常 有 限 的 长 度 ， 这 有 可 能 会 导 
致 出 现 问题 。POSIX 规 范 要 求 ARG_MAX 至 少 要 有 4096 个 字 节 © 

一 般 情 况 下 ，exec 了 芳 数 是 不 会 返回 的 ， 除 非 改 生 了 错误 。 出 现 错 
误 时 ，exec 函 数 将 返回 -1， 并 且 会 设置 销 误 变 量 errno. 

由 exec 局 动 的 新 进程 继承 了 原 进 程 的 许多 特性 。 特 别 地 ， 在 原 进 
程 中 已 打开 的 文件 描述 符 在 新 进程 中 仍 将 保持 打开 ， 除 非 它 们 的 “执行 
时 关闭 标志 ”(close on exec flag) 被 置 位 (详细 说 明 请 参考 第 3 章 中 对 


fcnt1 系 统 调用 的 介绍 ) 。 任 何在 原 进 程 中 已 打开 的 目录 流 都 将 在 新 进 
程 中 被 关闭 。 


2. 复 制 进程 映像 


要 想 让 进程 同时 执行 多 个 函数 ， 我 们 可 以 使 用 线程 (将 在 第 12 革 
介绍 ) 或 从 原 程 序 中 创建 一 个 完全 分 离 的 进程 ， 后 者 就 像 init 的 做 法 一 
样 ， 而 不 像 exec 调 用 那样 用 痢 程 序 殖 换 当 前 执行 的 线程 。 

我 们 可 以 通过 调用 fork 创 建 一 个 新 进程 。 这 个 系统 调用 复制 当前 
进程 ， 在 进程 表 中 创建 一 个 新 的 表 项 ， 新 表 项 中 的 许多 属性 与 当前 进 
程 羡 相同 的 。 痢 进程 几乎 与 原 进 程 一 模 一 样 ， 执 行 的 代码 也 完全 相 
同 ， 但 狐 进 程 有 目 己 的 数据 空间 、 环 境 和 文件 描述 符 。fork 和 exec 函 数 
结合 在 一 起 使 用 殉 是 创建 靳 进程 所 需要 的 一 切 了 。 


#include <sys/types.h> 
#include <unistd.h> 


pid t fork(void) ; 


最 初 的 进程 


了 了 | 


返回 一 个 新 的 PID 返回 0 


新 进程 


图 11-2 


名 11-2 


如 图 11-2 所 示 ， 在 父 进程 中 的 fork 调 用 返回 的 是 新 的 子 进程 的 
PID。 新 进程 将 继续 执行 ， 就 像 原 进程 一 样 ， 不 同 之 处 在 于 ， 子 进程 
中 的 fork 调 用 返回 的 是 0。 父 子 进程 可 以 通过 这 一 点 来 判断 究竟 谁 是 父 
进程 ， 谁 是 子 进程 。 

如 果 fork 失 败 ， 它 将 返回 -1。 失 败 通 常 是 因为 父 进程 所 拥有 的 子 进 
程 数目 超过 了 规定 的 限制 (CHILD MAX) ， 此 时 errno 将 被 设 为 
EAGAIN。 如 果 是 因为 进程 表 里 没 有 足够 的 空间 用 于 创建 新 的 表单 或 
虚拟 内 存 不 足 ，errno 变 量 将 被 设 为 ENOMEM. 

一 个 典型 的 使 用 fork 的 代码 片段 如 下 所 示 : 


SC 验 fork WA 
我 们 来 看 一 个 简单 的 例子 fork1.c: 


pid pi 


这 个 程序 以 两 个 进程 的 形式 在 运行 。 子 进程 被 创建 并 且 输 出 消息 5 
次 。 原 进程 〈 即 父 进程 ) 只 输出 消息 3 次 。 父 进程 在 子 进 程 打印 完 它 的 
全 部 消 居 之 前 束 结 束 了 ， 因 此 我 们 将 看 到 在 输出 内 容 中 混 洒 着 一 个 
shell 提 示 符 。 


$ ./forkl 


ES 

程序 在 调用 fork 时 被 分 为 两 个 独立 的 进程 。 程 序 通过 fork 调 用 返回 
的 非 零 值 确 定 父 进程 ， 并 根据 该 值 来 设置 消 轧 的 输出 次 数 ， 两 次 消 县 
的 输出 之 间 间 隔 一 秒 。 


11.3.1 竺 一 个 进程 


当 用 fork 局 动 一 个 子 进程 时 ， 子 进程 束 有 了 它 目 己 的 生命 周期 并 
将 独立 运行 。 有 时 ， 我 们 希望 知道 一 个 子 进程 何 时 结束 。 例 如 ， 在 前 
面 的 示例 程序 中 ， 父 进程 在 子 进程 之 前 结束 ， 由 于 子 进程 还 在 继续 运 
行 ， 所 以 得 到 的 输出 结 末 有 点 乱 。 我 们 可 以 通过 在 父 进 程 中 调用 wait 
函数 让 父 进程 等 待 子 进程 的 结束 。 


#include <sys/types.h> 
Kf include «sys/wait.h» 


píd t wait(int *stat loc); 


wait 系 统 调 用 将 暂停 父 进程 直到 它 的 子 进程 结束 为 止 。 这 个 调用 
返回 子 进程 的 PID， 它 通常 是 已 经 结束 运行 的 子 进程 的 PID. 状 态 信 息 允 
许 父 进程 了 解 子 进程 的 退出 状态 ， 即 子 进 程 的 main 函 数 返 回 的 值 或 子 
进程 中 exit 函 数 的 退出 码 。 如 果 stat loc 不 是 空 指 针 ， 状 态 信 息 将 被 写 
入 它 所 指向 的 位 置 。 
本 
7e 


表 11-20 


我 们 稍微 修改 一 下 程序 ， 让 父 进 程 等 待 并 检查 子 进程 的 退出 状 


x 验 waith 
仿 。 新 程序 zT 144 JJwait.c: 


LS 一 部 分 等 待 子 进 程 完成 : 


rminated abnormally\n"); 


运行 这 个 程序 时 ， 我 们 将 看 到 父 进 程 等 待 子 进 程 的 情况 : 


实验 解析 

父 进程 (从 fork 调 用 中 获得 一 个 非 零 的 返回 值 ， 用 wait 系 统 调用 将 
目 己 的 执行 挂 起 ， 直 到 子 进程 的 状态 信息 出 现 为 止 。 这 将 发 生 在 子 进 
程 调用 exit 的 时 候 。 我 们 将 子 进程 的 退出 码 设 置 为 37。 父 进程 然后 继续 
运行 ， 通 过 测试 wait 调 用 的 返回 值 来 判断 子 进 程 是 否 正常 终止 。 如 来 
古 ， 束 从 状态 信息 中 提取 出 子 进程 的 退出 码 。 


11.3.2 进程 


用 fork 来 创建 进程 确实 很 有 用 ， 但 你 必须 清楚 子 进程 的 运行 情 
况 。 子 进程 终止 时 ， 它 与 父 进程 之 间 的 关联 还 会 保持 ， 直 到 父 进 程 也 
正常 终止 或 父 进程 调用 wait 才 告 结 束 。 因 此 ， 进 程 表 中 代表 子 进 程 的 
表 项 不 会 立刻 释放 。 虽 然 子 进程 已 经 不 再 运行 ， 但 它 仍然 存在 于 系统 
中 ， 因 为 它 的 退出 码 还 需要 保存 起 来 ， 以 备 父 进程 今后 的 wait 调 用 使 
用 。 这 时 它 将 成 为 一 个 死 (defunct) 进程 或 僵尸 (zombie) 进程 。 

如 有 果 修 改 fork 示 例 程序 中 的 消息 输出 次 数 ， 我 们 束 能 看 到 僵尸 进 
程 。 如 果子 进程 输出 消息 的 次 数 少 于 父 进程 ， 它 束 会 率先 结束 并 成 为 
僵尸 进程 直到 父 进程 也 结束 。 


X 验 僵尸 进程 
] = 


fork2.c 和 forkl.c 基 本 一 样 ， 只 是 父 、 子 进程 输出 消息 的 次 数 对 调 
站。 下 面 是 相关 的 代码 行 : 


实验 解析 
如 果 用 。/fork2 & 命 令 来 运行 上 面 这 个 程序 ， 然 后 在 子 进程 结束 之 
后 父 进程 结束 之 前 调用 ps 程序 ， 我 们 将 会 看 到 如 下 阴影 显示 的 一 行 
(一 些 系统 可 能 使 用 <zombie> 而 不 是 <defunct>) 


nits pts 


exi pt j 


如 果 此 时 父 进程 异常 终止 ， 子 进程 将 自动 把 PID 为 1 的 进程 (RU 
init) 作为 自己 的 父 进程 。 子 进程 现在 是 一 个 不 再 运行 的 僵尸 进程 ， 但 
因为 其 父 进程 异常 终止 ， 所 以 它 由 init 进 程 接管 。 僵 尸 进程 将 一 直 保留 
在 进程 表 中 直到 被 init 进 程 发 现 并 释放 。 进 程 表 越 大 ， 这 一 过 程 束 越 
慢 。 应 该 尽量 避免 产生 僵尸 进程 ， 因 为 在 init 清 理 它 们 之 前 ， 写 们 将 一 
直 消 耗 系统 的 资源 。 

还 有 男 一 个 系统 调用 可 用 来 等 每 子 进 程 的 结束 ， 它 十 waitpid 芳 
数 。 你 可 以 用 它 来 等 待 某 个 特定 进程 的 结束 。 


#include <sys/types.h> 
M include «sys/wait.h» 


pid 参 数 指定 需要 等 待 的 子 进程 的 PID。 如 果 它 的 值 为 -1,waitpid 将 
返回 任 一 子 进程 的 信息 。 与 wait 一 样 ， 如 果 stat_loc 不 是 空 指 针 ， 
waitpid 将 把 状态 信息 写 到 它 所 指向 的 位 置 。option 参 数 可 用 来 改变 
waitpid 的 行为 ， 其 中 最 有 用 的 一 个 选项 是 WNOHANG， 它 的 作用 是 防 
止 waitpid 调 用 将 调用 者 的 执行 挂 起 。 你 可 以 用 这 个 选项 来 查找 是 否 
子 进程 已 经 结束 ， 如 果 没 有 ， 程 序 将 继续 执行 。 其 他 的 选项 和 wait 调 
用 的 选项 相同 。 

因此 ， 如 果 想 让 父 进程 周期 性 地 检查 某 个 特定 的 子 进程 是 否 已 终 
止 ， 就 可 以 使 用 如 下 的 调用 方式 : 


waitpid(child pid, (int *) 0, WNOHANG); 


一 一 人 


如 果子 进程 没有 结束 或 意外 终止 ， 它 就 返回 0 否则 返回 
child_pid。 如 果 waitpid 失 败 ， 它 将 返回 - RE 置 errno。 和 失败 的 情况 包 
括 : 没有 子 进 程 (ermo 设 置 为 ECHILD) 、 调 用 被 某 个 信号 中 断 

(EINTR) 或 选项 参数 无 效 (EINVAL) 。 


已 打开 的 文件 描述 符 将 在 fork 和 exec 调 用 之 后 保留 下 来 ， 我 们 可 以 
利用 对 进程 这 方面 知识 的 理解 来 改变 程序 的 行为 。 下 一 个 例子 涉及 一 
个 过 滤 程 序 ， 它 从 标准 输入 读 取 数据 ， 然 后 向 标准 输出 写 数 据 ， 同 时 
在 输入 和 输出 之 间 对 数据 做 一 些 有 用 的 转换 。 


实 验 重 定向 
下 面 是 一 个 非常 简单 的 过 小 程序 upper.c， 它 读 取 输入 并 将 输入 字 
符 转 换 为 大 写 : 


运行 这 个 程序 时 ， 它 按照 我 们 预期 的 那样 执行 ， 如 下 所 示 : 


$ ./upper 


当然 还 可 以 利用 shell 的 重 定向 把 一 个 文件 的 内 容 全 部 转换 为 大 
=, ADMIN 


如 果 我 们 想 在 另 一 个 程序 中 使 用 这 个 | 过 小 程序 会 发 生 什么 情 痪 


We? 下面 这 个 程序 useupper.c 接 受 一 个 文件 名 作为 命令 行 参数 ， 如 有 果 对 
它 的 调用 不 正确 ， 它 将 啊 应 一 个 错误 信息 。 


重新 打开 标准 输入 ， 并 再 次 检查 有 无 错误 发 生 ， 然 后 用 execl 调 用 
upper 程 序 : 


不 要 起 记 execl 会 蔡 换 掉 当 前 的 进程 。 如 果 没 有 发 生 错 误 ， 简 下 的 
这 些 语句 将 不 会 被 执行 : 


实验 解析 

运行 这 个 程序 时 ， 我 们 可 以 提供 给 它 一 个 文件 ， 让 它 把 该 文件 的 
内 容 全 部 转换 为 大 写 。 这 项 工作 由 程序 upper 完 成 ， 但 它 并 不 处 理 文 件 
名 参数 。 注 意 ， 我 们 并 不 需要 upper 程 序 的 源 代码 。 我 们 可 以 利用 这 种 
方法 运行 任何 可 执行 程序 : 


$ ./useupper file.txt 


useuppert F Hi freopen EN Zi ^c KA PERI A, SAR RCE it stdin 
与 程序 参数 给 定 的 文件 名 关联 起 来 。 接 下 来 ， 它 调用 execl 用 upper 程 序 
玲 换 挥 正在 运行 的 进程 代码 。 因 为 已 打开 的 文件 搬 述 从 会 在 execl 调 用 
HERE i 所 以 upper 程 序 的 运行 情况 和 它 在 shell 提 示 符 下 的 运行 
情况 完全 一 样 : 


$ ./upper < file.txt 


11.3.4 “线程 


Linux 系 统 中 的 进程 可 以 互相 协作 、 互 相 发 送 消息 、 互 相 中 断 ， 甚 
至 可 以 共享 内 存 段 。 但 从 本 质 上 来 说 ， 它 们 是 操作 系统 内 各 自 独立 的 
实体 ， 要 想 在 它们 之 间 共 享 变量 并 不 是 很 容易 。 

在 许多 UNIX 和 Linux 系 统 中 都 有 一 类 进程 叫做 线程 (thread) 。 涉 
及 线程 的 编程 是 比较 困难 的 ， 但 它 在 某 些 应 用 软件 (如 多 线程 数据 库 
服务 器 ) 中 又 有 很 大 的 用 处 。 在 Linux (或 UNIX) 系统 中 编写 线程 程 
序 并 不 像 编 写 多 进程 程序 那么 常见 ， 因 为 Linux 中 的 进程 都 是 非常 轻 量 
级 的 ， 而 且 编 写 多 个 互相 协作 的 进程 比 编写 线程 要 容易 得 多 。 我 们 将 
在 第 12 章 介绍 线程 。 
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信号 是 UNIX 和 Linux 系 统 啊 应 某 些 条 件 而 产生 的 一 个 事件 。 接 收 
到 该 信号 的 进程 会 相应 地 采取 一 些 行动 。 我 们 用 术语 生成 (raise) 表 
示 一 个 信号 的 产生 ， 使 用 术语 捕获 (catch) 表示 接收 到 一 个 信号 。 信 
写 征 由 于 某 些 错误 条 件 而 生成 的 ， 如 内 存 段 冲 突 、 浮 点 处 理 亏 错误 或 
非法 指令 等 。 它 们 由 shell 和 终端 处 理 絮 生成 来 引起 中 断 ， 它 们 还 可 以 
作为 在 进程 间 传 递 消 恩 或 修改 行为 的 一 种 方式 ， 明 确 地 由 一 个 进程 发 
送 给 另 一 个 进程 。 无 论 何 种 情况 ， 它 们 的 编程 接口 都 是 相同 的 。 信 和 号 
可 以 被 生 成 、 捕 获 、 响 应 或 (至少 对 于 一 些 信号 ) 忽略 。 
信号 的 名 称 是 在 头 文件 signalh 中 定义 的 。 它 们 以 SIG 开 头 ， 见 表 


11-3 


# 11-3 


sear ig 3A 


* 系 统 对 信号 的 啊 应 视 具 体 实现 而 定 。 

如 有 果 进 程 接 收 到 这 些 信 和 号 中 的 一 个 ， 但 事先 没有 安排 捕获 它 ， 进 
程 将 会 立刻 终止 。 通 第 ， 系 统 将 生成 核心 转 储 文件 core， 并 将 其 放 在 
nu 目录 下 。 该 文件 是 进程 在 内 存 中 的 映像 ， 它 对 程序 的 调试 很 有 用 


其 他 信号 见 表 11-4。 


表 11-4 


SIGCHLD 信 号 对 于 管理 子 进程 很 有 有 用。 默认 情况 下 ， 它 是 被 忽略 
的 。 其 余 的 信号 会 使 接收 它们 的 进程 停止 运行 ， 但 SIGCONT 是 个 例 
外 ， 它 的 作用 是 让 进程 恢复 并 继续 执行 。shell 脚 本 通过 它 来 控制 作 
业 ， 但 用 户 程 序 很 少 会 用 到 它 。 

稍 后 我 们 将 对 表 11-3 中 的 信号 做 进一步 的 介绍 。 现 在 ， 我 们 只 需 
知道 如 果 shell 和 终端 驱动 程序 是 按 通 常情 况 配 置 的 话 ， 在 键盘 上 癌 入 
中 上 断 字 符 (通常 是 Ctrlt+C 组 合 键 ) 就 会 向 前 台 进 程 ( 即 当 前 正在 运行 
的 程序 ) 发送 SIGINT 信 号 ， 这 将 引起 该 程序 的 终止 ， 除 非 它 事先 安排 
了 捕获 这 个 信号 。 

如 果 想 发 送 一 个 信号 给 进程 ， 而 该 进程 并 不 是 当前 的 前 台 进 程 ， 
就 需要 使 用 kill 命 令 。 该 命令 需要 有 一 个 可 选 的 信号 代码 或 信号 名 称 和 
一 个 接收 信号 的 目标 进程 的 PID 〈 这 个 PID 一 般 需 要 用 ps 命令 查 出 
来 ) 。 例 如 ， 如 果 要 和 同和 运行 在 另 一 个 终端 上 的 PID 为 512 的 进程 发 
送 “ 挂 断 ” 信 号 ， 可 以 使 用 如 下 命令 : 
$ kill -HUP 512 

ki 命令 有 一 个 有 用 的 变 体 叫 killall， 它 可 以 给 运行 着 某 一 命令 的 
所 有 进程 发 送信 号 。 并 不 是 所 有 的 UNIX 系 统 都 支持 它 ， 但 Linux 系 统 
一 般 都 有 该 命令 。 如 果 不 知 道 某 个 进程 的 PID ， 或 者 想 给 执行 相同 命 
令 的 许多 不 同 的 进程 发 送信 号 ， 这 条 命令 就 很 有 用 了 。 一 种 常见 的 用 
法 是 ， 通 知 inetd 程 序 重 新 读 取 它 的 配置 选项 ， 要 完成 这 一 工作 ， 可 以 
使 用 下 面 这 条 命令 : 
$ killall -HUP inetd 

程序 可 以 用 signal 库 函数 来 处 理 信号 ， 它 的 定义 如 下 所 示 : 


#include <signal.h> 


void (*signal(int sig, void {*func) (int))) (int); 


这 个 相当 复杂 的 函数 定义 说 明 ，signal 是 一 个 带 有 sig 和 func 两 个 参 
数 的 函数 。 准备 捕获 或 忽略 的 信号 由 参数 sig 给 出 ， 接 收 到 指定 的 信和 号 
后 将 要 调用 的 函数 由 参数 func 给 出 。 信 和 号 处 理 国 数 必须 有 一 个 int 类 型 
的 参数 〈 即 接收 到 的 信号 代码 ) 并 且 返 回 类 型 为 void。signal 函 数 本 喘 
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表 11-5 


通过 一 个 实例 可 以 更 清楚 地 理解 信号 的 处 理 方 法 。 下 面 我 们 来 编 
5 与 一 个 程序 ctlc c， 它 将 啊 应 用 户 敲 入 的 Ctrlt+C 组 合 刍 ， 在 屏幕 上 打印 

条 适当 的 消 息 而 不 是 终止 程序 的 运行 。 当 用 户 第 二 次 按 下 Ctrl+C 
时 ， 程序 将 结束 运行 。 


实 验 信号 处 理 

函数 ouch 对 通过 参数 sig 传 递 进来 的 信号 作出 啊 应 。 信 和 号 出 现时 ， 
程序 EDT 它 先 打印 一 条 消息 ， 然 后 将 信号 SIGINT (默认 情况 
下 ， 按 下 Cal+C 将 产生 这 个 信号 ) 的 处 理 方式 恢复 为 默认 行为 。 


main EN ERICH E FA Æ, poculi cuo UE 
a 没有 信号 出 现时 ， 它 会 在 一 个 无 限 循环 中 每 隔 一 秒 打 印 一 条 消 


int mair 


第 一 次 按 下 Ctrl+C 组 合 键 会 让 程序 作出 响应 ， 然 后 程序 继续 执 
行 。 再 次 按 下 Ctrl+C 组 合 键 时 ， 程 序 将 结束 运行 ， 因 为 SIGINT 信 号 的 
处 理 方式 已 恢复 为 默认 行为 一 终止 程序 的 运行 。 


在 此 例 中 我 们 可 以 看 到 ， 信 和 号 处 理 函 数 使 用 了 一 个 单独 的 整数 参 
RM, Cites EKO AAA STS ^. UR ia ee] — PS CH 
处 理 多 个 信号 ， 这 个 参数 束 很 有 用 。 在 本 例 中 ， 我 们 打印 出 SIGINT 的 
值 ， 它 的 值 在 这 个 系统 中 恰好 钙 2， 但 你 不 能 过 分 依赖 传统 的 信号 数字 
值 ， 而 应 该 在 新 的 程序 中 总 是 使 用 信号 的 名 字 。 


在 信号 处 理 函 数 中 ， 调 用 如 printf 这 样 的 函数 是 不 安全 的 。 一 
个 有 用 的 技巧 征 ， 在 信号 处 理 函 数 中 设置 一 个 标志 ， 然 后 在 主 程 
序 中 检查 该 标志 ， 如 和 需要 束 打 印 一 条 消 恩 。 在 本 章 的 结尾 部 分 ， 
你 将 会 看 到 一 个 函数 列表 ， 表 中 的 函数 都 可 以 在 信号 处 理 函 数 中 
被 安全 地 调用 。 


实验 解析 

程序 中 安排 函数 ouch 来 处 理 在 按 下 Ctrlt+C 组 合 键 时 所 产生 的 
SIGINT 人 信号。 程序 会 在 中 断 画 数 ouch 处 理 完 毕 后 继续 执行 ， 但 信号 处 
理 方 式 已 恢复 为 默认 行为 (不同 版 本 的 UNIX 系 统 ， 特 别 是 从 Berkley 
UNIX 衍 生出 来 的 那些 版 本 ， 在 对 信号 的 处 理 方 式 上 从 历史 上 就 有 些 细 
微 的 不 同 。 如 果 想 让 信号 的 处 理 方式 在 信号 发 生 后 恢复 到 其 默认 行 
为 ， 最 好 的 方法 就 是 自己 写 出 具体 的 信号 处 理 代码 ) 。 当 它 接 收 到 第 
二 个 SIGINT 信 号 后 ， 程 序 将 采取 默认 的 行动 ， 即 终止 程序 的 运行 。 

如 果 想 保留 信号 处 理 函 数 ， 让 它 继续 响应 用 户 的 Ctrl+C 组 合 键 ， 
我 们 就 需要 再 次 调用 signal 函 数 来 重新 建立 它 。 这 会 使 信号 在 一 段 时 间 
内 无 法 得 到 处 理 ， 这 段 时 间 从 调用 中 断 函 数 开 始 ， 到 信和 号 处 理 函 数 的 
重建 为 止 。 如 果 在 这 段 时 间 内 程序 接收 到 第 二 个 信号 ， 它 就 会 违背 我 
们 的 意愿 终止 程序 的 运行 。 


我 们 不 推荐 大 家 使 用 signal 接 口 。 之 所 以 会 在 这 里 介绍 它 ， 是 
因为 你 可 能 会 在 许多 老 程 序 中 看 到 它 的 应 用 。 稍 后 我 们 会 介绍 一 
个 定义 更 清晰 、 执 行 更 可 靠 的 画 数 sigaction， 在 所 有 的 新 程序 中 
都 应 该 使 用 这 个 函数 。 
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数 指针 ， 如 果 未 定义 信号 处 理 函 数 ， 则 返回 SIG_ERR 并 设置 errno 为 一 
个 正 数值 。 如 果 给 出 的 是 一 个 无 效 的 信号 ， 或 者 党 试 处 理 的 信号 是 不 
可 捕获 或 不 可 忽略 的 信号 (如 SIGKILL) ,errno 将 被 设置 为 EINVAL ° 


11.4.1 发 送信 号 


进程 可 以 通过 调用 kl 函数 同 包 括 它 本 身 在 内 的 其 他 进程 发 送 一 个 
信和 号。 如 末 程 序 没 有 发 送 该 信号 的 权限 ， 对 ki 函数 的 调用 就 将 失败 ， 
失败 的 常见 原因 是 目标 进程 由 为 一 个 用 户 所 拥有 。 这 个 函数 和 同名 的 
shell 命 令 完 成 相同 的 功能 ， 它 的 定义 如 下 所 示 : 


int killipid_t pid, int aig); 


kill 函数 把 参数 sig 给 定 的 信号 发 送 给 由 参数 PID 给 出 的 进程 号 所 指 
定 的 进程 ， 成 功 时 它 返 回 0。 要 想 发 送 一 个 信号 ， 发 送 进程 必须 拥有 相 
应 的 权限 。 这 通常 意味 着 两 个 进程 必须 拥有 相同 的 用 户 ID ( 即 你 只 能 
发 送信 号 给 属于 自己 的 进程 ， 但 超级 用 户 可 以 发 送信 号 给 任何 进 


程 ) 。 

kill 调 用 会 在 失败 时 返回 -1 并 设置 ermo 变 量 。 失 败 的 原因 可 能 是 : 
给 定 的 信号 无 效 (errno 设 置 为 EINVAL) ; 发 送 进程 权限 不 够 (errno 
设置 为 EPERM) ; 目标 进程 不 存在 (errno 设 置 为 ESRCH) 。 

信号 向 我 们 提供 了 一 个 有 用 的 闸 钟 功能 。 进 程 可 以 通过 调用 alarm 
函数 在 经 过 预定 时 间 后 发 送 一 个 SIGALRM 信 号。 


Sinclude <unistd.h> 


unsigned int alarm(unsigned int seconds); 


alarm ER 2 A 9K ££ seconds) Z Ja c 4E A x& — 1 SIGALRMfz 5 ° {E 
由 于 处 理 的 延 时 和 时 间 调 度 的 不 确定 性 ， 实 际 闹钟 时 间 将 比 预先 安排 
的 要 稍 币 拖 后 一 点 儿 。 把 参数 seconds 设 置 为 0 将 取消 所 有 已 设置 的 阐 
钟 请 求 。 如 果 在 接收 到 SIGALRM 信 号 之 前 再 次 调用 alarm 函 数 ， 则 六 
钟 重 新 开始 计时 。 每 个 进程 只 能 有 一 个 疝 钟 时 间 。alarm 函 数 的 返回 值 
是 以 前 设置 的 曾 钟 时 间 的 余 留 秒 数 ， 如 有 果 调 用 失败 则 返回 -1 。 

为 了 说 明 alarm 函 数 的 工作 情况 ， 我 们 通过 使 用 fork、sleep 和 signal 
来 模拟 它 的 效果 。 程 序 可 以 启动 一 个 新 的 进程 ， 它 专门 用 于 在 未 来 的 
某 一 时 刻 发 送 一 个 信号 。 


Sc 验 BUT PR 
alarm. sae =e 数 ding 的 作用 是 模拟 一 个 疝 钟 。 


在 main 范 数 中 ， 我 们 告诉 子 进程 在 等 待 5 秒 后 发 送 一 个 SIGALRM 
信号 给 它 的 父 进程 。 


pidt p 


父 进程 通过 一 个 signal 调 用 安排 好 捕获 SIGALRM 信 号 的 工作 ， 然 
LSU 
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这 个 程序 用 到 了 一 个 新 的 函数 pause， 它 的 作用 很 简单 ， 束 是 把 程 
序 的 执行 挂 起 直到 有 一 个 信号 出 现 为 止 。 当 程序 接收 到 一 个 信号 时 ， 
预 设 好 的 信号 处 理 函 数 将 开始 运行 ， 程 序 也 将 恢复 正常 的 执行 。pause 
函数 的 定义 如 下 所 示 : 

当 它 被 一 个 信号 中 断 时 ， 将 返回 -1 〈 如 果 下 一 个 接收 到 的 信号 没有 导 
致 程序 终止 的 话 ) 并 把 ermo 设 置 为 EINTR。 当 需要 等 待 信号 时 ， 一 个 
uos pone 稍 后 将 要 介绍 的 sigsuspend 函 数 。 

aci 
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回 其 父 进 程 发 送 一 个 SIGALRM 信 号 。 父 进程 在 安排 好 捕获 SIGALRM 
信号 后 特 停 运行 ， 直 到 接收 到 一 个 信号 为 止 。 我 们 并 未 在 信号 处 理 函 
数 中 直接 调用 printft， 而 是 通过 在 该 函数 中 设置 标志 ， 然 后 在 main 函 数 
中 检查 该 标志 来 完成 消息 的 输出 。 

使 用 信号 并 挂 起 程序 的 执行 是 Linux 程 序 设计 中 的 一 个 重要 部 分 。 
这 意味 着 程序 不 需要 总 是 在 执行 着 。 程 序 不 必 在 一 个 循环 中 无 休止 地 
检查 某 个 事件 是 否 已 发 生 ， 相 反 ， 它 可 以 等 待 事件 的 发 生 。 这 在 只 
一 个 CPU 的 多 用 户 环境 中 尤其 重要 ， 进 程 共享 着 一 个 处 理 器 ， 党 人 忙 的 
等 待 将 会 对 系统 的 性 能 造成 极 大 的 影响 。 程 序 中 信和 号 的 使 用 将 带 来 一 
个 特殊 的 问题 : “如 果 信 号 出 现在 系统 调用 的 执行 过 程 中 会 发 生 什 么 情 
D? ”答案 是 相当 让 人 不 满意 的 “ 视 情 况 而 定 ”。 一 般 来 说 ， 你 只 需要 考 
虐 慢 系统 调用 ， 例 如 从 终端 读数 据 ， 如 果 在 这 个 系统 调用 等 符 数 据 时 
出 现 一 个 信号 ， 它 就 会 返回 一 个 错误 。 如 果 你 开始 在 自己 的 程序 中 使 
用 信号 ， 就 需要 注意 一 些 系 统 调用 会 因为 接收 到 了 一 个 信号 而 失败 ， 
而 这 种 错误 情况 可 能 是 你 在 添加 信号 处 理 函 数 之 前 没有 考虑 到 的 。 

在 编写 程序 中 处 理 信 号 部 分 的 代码 时 必须 非常 小 心 ， 因 为 在 使 用 
信号 的 程序 中 会 出 现 各 种 各 样 的 “ 竞 态 条 件 ”。 例 如 ， 如 果 想 调用 pause 
等 待 一 个 信号 ， 可 信和 号 却 出 现在 调用 pause 之 前 ， 就 会 使 程序 无 限期 地 
等 待 一 个 不 会 发 生 的 事件 。 这 些 竞 态 条 件 都 是 一 些 对 时 间 要 求 很 苛刻 
的 问题 ， 许 多 编程 新 手 都 有 这 方面 的 烦恼 ， 所 以 在 检查 和 信号 相关 的 
代码 时 总 是 要 非常 小 心 。 


一 个 健壮 的 信号 接口 
我 们 已 经 对 用 signal 和 其 相关 函数 来 生成 和 捕获 信号 做 了 比较 深入 
的 介绍 ， 因 为 它们 在 传统 的 UNIX 编 程 中 很 常见 。 但 X/Open 和 UNIX 规 


GHEE TP RPA REIS UHSEASRETI sigaction > 它 的 定义 如 
ZN: 


#include <signal.h> 


int sigaction(int sig, const struct sigaction *act, struct sigaction *oact); 


sigaction 结 构 害 义 在 文件 signal.h 中 ， 它 的 作用 是 定义 在 接收 到 参 
数 sig 指 定 的 信号 后 应 该 采取 的 行动 "该 结构 至 少 应 该 包括 以 下 几 个 成 
Dd: 


sigaction EK ZI i E 5 fei sig EXHI SIE ° UW Roat Ne Z RET ， 
sigaction 将 把 原先 对 该 信号 的 动作 写 到 它 指 辣 的 位 置 。 如 果 act 是 空 指 
针 ， 则 sigaction 函 数 葡 不 需要 再 做 其 他 设置 了 ， 否 则 将 在 该 参数 中 设 
置 对 指定 信号 的 动作 。 

5j signal 函数 一 样 ，sigaction 函 数 会 在 成 功 时 返回 0， 失 败 时 返 
回 -1。 如 采 给 出 的 信号 无 效 或 者 试图 对 一 个 不 允许 被 捕获 或 忽略 的 信 
号 进行 捕获 或 忽略 ， 错 误 变 量 errno 将 被 设置 为 EINVAL 。 

在 参数 act 指 同 的 sigaction 结 构 中 ，sa_handler 是 一 个 函数 指针 ， 它 
指 辣 接收 到 信和 号 sig 时 将 被 调用 的 信号 处 理 芳 数 。 它 相当 于 前 面 见 到 的 
传递 给 函数 signal 的 参数 func。 我 们 可 以 将 sa_handler 字 上 段 设 置 为 特殊 值 
SIG_IGN 和 SIG_DFL， 它 们 分 别 表 示 信 和 号 将 被 忽略 或 把 对 该 信号 的 处 
理 方式 恢复 为 默认 动作 。 

sa_mask 成 员 指 定 了 一 个 信号 集 ， 在 调用 sa_handler 所 指 癌 的 信号 
处 理 函 数 之 前 ， 该 信号 集 将 被 加 入 到 进程 的 信号 屏蔽 字 中 。 这 是 一 组 
将 被 阻塞 旦 不 会 传递 给 该 进程 的 信和 号。 设置 信号 屏蔽 字 可 以 防止 前 面 
看 到 的 信和 号 在 它 的 处 理 函 数 还 未 运行 结束 时 束 被 接收 到 的 情况 。 使 用 
sa_mask 字 段 可 以 消除 这 一 竞 态 条 件 。 

但 是 ， 由 sigaction 函 数 设 置 的 信号 处 理 函 数 在 默认 情况 下 是 不 被 
重 置 的 ， 如 采 硕 望 获得 类 似 前 面 用 第 二 次 signal 调 用 对 信和 号 处 理 进行 重 
置 的 效果 ， 束 必须 在 sa_flags 成 员 中 包含 值 SA_RESETHAND。 在 深入 
T f£sigaction EN Zt ZZ Bj, RA] FH sigaction # f% signal X EE 55 fE FF 


ctrlc.c ° 


sx 验 sigactionER2 
按照 下 面 给 出 的 代码 修改 我 们 的 程序 ， 用 sigaction 来 截获 SIGINT 
信号 。 我 们 将 新 的 程序 命名 为 ctrlc2.C。 


运行 这 个 新 版 程序 时 ， 只 要 按 下 Ctrl+C 组 合 键 ， 就 可 以 看 到 一 条 
消息 。 因 为 sigaction 函 数 连续 处 理 到 来 的 SIGINT 信 号 。 要 想 终 止 这 个 
程序 ， 我 们 只 能 按 下 Ctrl+\ 组 合 键 ， 它 在 默认 情况 下 产生 SIGQUIT 信 
5 o 


./ctrlc2 


实验 解析 

这 个 程序 用 sigaction 代 替 signal 来 设置 Ctrl+C 组 合 键 (SIGINT fii 
5) 的 信号 处 理 函 数 为 ouch。 它 首先 必须 设置 一 个 sigaction 结 构 ， 在 
该 结构 中 包含 信号 处 理 函 数 、 信 和 号 屏蔽 字 和 标志 。 在 本 例 中 ， 我 们 不 
ES ， 并 通过 调用 新 的 函数 sigemptyset 来 创建 空 的 信号 
XE 。 


运行 完 这 个 程序 后 ， 你 将 发 现在 当前 目录 下 多 了 一 个 core 文 
件 ， 你 可 以 安全 地 删除 它 。 


11.4.2 信号 集 


头 文件 signalh 定 义 了 类 型 sigset t 和 用 来 处 理 信号 集 的 函数" 
sigaction 和 其 他 函数 将 用 这 些 信号 集 来 修改 进程 在 接收 到 信号 时 的 行 
为 o 


int sigaddset(sigset t *set, int signo); 
int sigemptyset(sigset t *set); 
int sigfillset[sigset t *set); 
int sigdelset(sigset t *set, int signo); 


1k HE EK AT IH BRE RITE TR F © sigemptyset AE fi SRK) 
始 化 为 空 。sigfillset 将 信号 集 初 始 化 为 包含 所 有 已 定义 的 信号 。 
sigaddset 和 sigdelset 从 信和 号 集中 增加 或 删除 给 定 的 信号 (signo) ° 它们 
在 成 功 时 返回 0， 失 败 时 返回 -1 并 设置 erno。 只 有 一 个 错误 代码 被 定 
义 ， 即 当 给 定 的 信号 无 效 时 ，errno 将 设置 为 EINVAL ° 

国 数 sigismember 判 断 一 个 给 定 的 信号 是 否 是 一 个 信号 集 的 成 员 。 
如 果 是 就 返回 1， 如 果 不 是 ， 它 就 返回 9; 如 果 给 定 的 信号 无 效 ， 它 就 
返回 -1 并 设置 errno 为 EINVAL ° 


finclude <signal.h> 


进程 的 信号 屏蔽 字 的 设置 或 检查 工作 由 画 数 sigprocmask 来 完成 。 
信号 屏蔽 字 是 指 当前 被 阻塞 的 一 组 信号 ， 它 们 不 能 被 当前 进程 接收 
到 。 


finclude «signal.h» 


int sigprocmask(int how, const sigset t *set, sigset t *oset); 


sigprocmask 函 数 可 以 根据 参数 how 指 定 的 方法 修改 进程 的 信号 屏 
茵 字 。 新 的 信号 屏蔽 字 由 参数 set (如 采 它 不 为 空 ) 指定 ， 而 原先 的 信 
号 屏蔽 字 将 保存 到 信和 号 集 oset 中 。 

参数 how 的 取 值 可 以 是 表 11-6 中 的 一 个 。 


表 11-6 
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如 果 参 数 set 是 空 指 针 ，how 的 值 就 没有 意义 了 ， 此 时 这 个 调用 的 
唯一 目的 就 是 把 当前 信号 屏蔽 字 的 值 保存 到 oset 中 。 


如 宁 sigprocmask 成 功 完 成 ， 它 将 返回 0， 如 果 参 数 how 取 值 无 效 ， 
它 将 返回 -1 并 设置 errno 为 EINVAL 。 

如 果 一 个 信号 被 进程 阻塞 ， 它 承 不 会 传递 给 进程 ， 但 会 停留 在 行 
处 理 状态 。 程 序 可 以 通过 调用 函数 sigpending 来 查看 它 阻塞 的 信号 中 有 
哪些 正 停留 在 待 处 理 状态 。 


#include «signal.h» 


这 个 函数 的 作用 是 ， 将 被 阻塞 的 信号 中 停留 在 竺 处理 状态 的 一 组 
信号 写 到 参数 set 指 回 的 信号 集中 。 成 功 时 它 将 返回 0， 否 则 返回 -1 并 设 
置 errno 以 表明 错误 的 原因 。 如 果 程 序 需要 处 理 信号 ， 同 时 又 需 要 控制 
信号 处 理 函 数 的 调用 时 间 ， 这 个 函数 就 很 有 用 了 。 

进程 可 以 通过 调用 sigsuspend 范 数 挂 起 自己 的 执行 ， 直 到 信号 集中 
m i woes 。 这 是 我 们 前 面 见 到 的 pause 函 数 更 通用 的 一 种 表 
TUE X 。 


Kfinclude «signal.h» 


sigsuspend ER ŽOK XE FEES BE CT. PRN HS ZXsigmask28 H1 BJ fei S 
集 ， 然 后 挂 起 程序 的 执行 。 程 序 将 在 信号 处 理 函 数 执行 完毕 后 继续 执 
行 。 如 果 接 收 到 的 信号 终止 了 程序 ，sigsuspend 束 不 会 返回 如 采 接 收 
到 的 信号 没有 终止 程序 ，sigsuspend 束 返回 -1 并 将 errmo 设 置 为 EINTR ° 

1. sigaction 标 志 

用 在 sigaction 函 数 里 的 sigaction 结 构 中 的 sa_flags 字 段 可 以 包含 表 
11-7 中 的 取 值 ， 它 们 用 于 改变 信号 的 行为 。 


表 11-701 


当 一 个 信号 被 捕获 时 ，SA_RESETHAND 标 志 可 以 用 来 自动 清除 
它 的 信号 处 理 函 数 ， 就 如 同 我 们 在 前 面 所 看 到 的 那样 。 

程序 中 使 用 的 许多 系统 调用 都 是 可 中 断 的。 也 融 是 说 ， 当 接收 到 
一 个 信号 时 ， 它 们 将 返回 一 个 错误 并 将 ermo 设 置 为 EINTR， 表 明 函 数 
是 因为 一 个 信号 而 返回 的 。 使 用 了 信号 的 应 用 程序 需要 特别 注意 这 一 
行为 。 如 果 sigaction 调 用 中 的 sa_flags 字 段 设置 了 SA_RESTART 标 志 ， 
ABA TEAS REB ERAT SEZ, KAREN e Ss FRUIT e 


一 般 的 做 法 是 ， 信 和 号 处 理 函 数 正 在 执行 时 ， 新 接收 到 的 信和 号 将 在 
该 处 理 函 数 的 执行 期 间 被 添加 到 进程 的 信号 屏蔽 字 中 。 这 防止 了 同一 
信号 的 不 断 出 现 引起 信号 处 理 函 数 的 再 次 运行 。 如 果 信 和 号 处 理 函 数 是 
一 个 不 可 重 入 的 函数 ， 在 它 结束 对 第 一 个 信号 的 处 理 之 前 又 让 另 一 个 
信号 再 次 调用 它 就 有 可 能 引起 问题 。 但 如 果 设 置 了 SA_NODEFER 标 
志 ， 当 程序 接收 到 这 个 信号 时 就 不 会 改变 信号 屏蔽 字 。 

信号 处 理 函 数 可 以 在 其 执行 期 间 被 中 断 并 再 次 被 调用 。 当 返回 到 
第 一 次 调用 时 ， 它 能 否 继续 正确 操作 是 很 关键 的 。 这 不 仅仅 是 递归 
(调用 自身 ) 的 问题 ， 而 是 可 重 入 〈 可 以 安全 地 进入 和 再 次 执行 ) 的 
问题 。Linux 内 核 中 ， 在 同一 时 间 负 责 处 理 多 个 设备 的 中 上 断 服 务 例 程 就 
需要 是 可 重 入 的 ， 因 为 优先 级 更 高 的 中 断 可 能 会 在 同一 段 代 码 的 执行 
期 间 “ 插 入 ”进来 。 

表 11-8 中 列 出 的 是 可 以 在 信号 处 理 函 数 中 安全 调用 的 函数 。 
X/Open 规范 保证 它们 都 是 可 重 入 的 或 者 本 身 不 会 再 生成 信号 的 。 


所 有 未 列 在 表 11-8 中 的 函数 ， 在 涉及 信号 处 理 时 ， 都 和 被 认为 


征 不 安全 的 。 


表 11-8 


2. 常用 信号 参考 
在 这 一 小 节 ， 我 们 列 出 Linux 和 UNIX 程 序 常用 的 信号 及 其 默认 行 


为 。 

表 11-9 中 信和 号 的 默认 动作 都 是 异常 终止 进程 ， 进 程 将 以 _exit 调 用 
方式 退出 ( 它 类 似 exit， 但 在 返回 到 内 核 之 前 不 作 任 何 清理 工作 ) 。 但 
进程 的 结束 状态 会 传递 到 wait 和 waitpid 函 数 中 去 ， 从 而 表明 进程 是 因 


某 个 特定 的 信号 而 异常 终止 的 。 
表 11-9 
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表 11-10 
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默认 情况 下 ， 进 程 接 收 到 列 在 表 11-11 中 的 信 me 3 


表 11-11 
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SIGCONT 言 号 的 作用 征 重 局 被 暂 保 的 进程 ， 如 果 进 程 没有 暂停， 
则 忽略 该 信号 。SIGCHLD 信 号 在 默认 情况 下 被 忽略 。 


表 11-12 
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11.5 小结 


在 本 章 中 ， 我 们 知道 了 进程 是 如 何 成 为 Linux 操 作 系统 的 一 个 基本 
组 成 部 分 的 。 我 们 学 习 了 如 何 启动 进程 、 终 止 进程 和 查看 进程 ， 如 何 
用 它们 来 解决 程序 设计 问题 。 我 们 还 介绍 了 信和 号 这 种 可 以 用 来 控制 程 
序 运行 行为 的 事件 。 此 外 ， 我 们 还 了 解 了 所 有 的 Linux 进 程 ， 包 括 init 
Eo musa risate 

S Y o 


-这 里 指 的 是 进程 暂停 ， 当 子 进程 终止 时 ， 仍 旧 会 产生 SIGCHLD 信 
Eye — pH 
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在 第 1 竟 中 我 们 介绍 了 如 何在 Linux (包括 UNIX) 中 处 理 进 
程 。 类 UNIX 操 作 系 统 早 就 具备 这 种 多 进程 功能 了 。 但 有 时 人 们 认为 ， 
用 fork 调 用 来 创建 新 进程 的 代价 太 高 。 在 这 种 情况 下 ， 如 果 能 让 一 个 
进程 同时 做 两 件 事情 或 至 少 看 起 来 是 这 样 将 会 非常 有 用 。 而 且 ， 你 可 
能 希望 能 有 两 件 或 更 多 的 事情 以 一 种 非常 紧密 的 方式 同时 发 生 。 这 就 
是 需要 线程 发 挥 作 用 的 时 候 了 。 

在 本 章 中 ， 我 们 将 介绍 以 下 内 容 : 

O “在 进程 中 创建 新 线程 

口 “ 在 一 个 进程 中 同步 线程 之 间 的 数据 访问 

O 修改 线程 的 属性 

o 在 同一 个 进程 中 ， 从 一 个 线程 中 控制 另 一 个 线程 


12.1 和 是 线程 


在 一 个 程序 中 的 多 个 执行 路 线 就 叫做 线程 (thread) 。 更 准确 的 定 
义 是 : 线程 是 一 个 进程 内 部 的 一 个 控制 序列 。 虽 然 Linux 和 许多 其 他 的 
操作 系统 一 样 ， 都 擅长 同时 运行 多 个 进程 ， 但 迄今 为 止 我们 看 到 的 所 
有 程序 在 执行 时 都 是 作为 一 个 单独 的 进程 。 事 实 上， 所 有 的 进程 都 至 
少 有 一 个 执行 线程 。 到 目前 为 止 ， 在 本 书 中 看 到 的 所 有 进程 都 只 有 一 
个 执行 线程 。 

弄 清 楚 fork 系 统 调用 和 创建 新 线程 之 间 的 区 别 非常 重要 。 当 进程 
执行 fork 调 用 时 ， 将 创建 出 该 进程 的 一 份 新 副本 。 这 个 新 进程 拥有 目 
己 的 变量 和 上 自己 的 PID ， 它 的 时 间 调 度 也 是 独立 的 ， 它 的 执行 GH 
T$) 几乎 完全 独立 于 父 进程 。 当 在 进程 中 创建 一 个 新 线程 时 ， 新 的 执 
行 线 程 将 拥有 目 己 的 栈 (因此 也 有 目 己 的 局 部 变量 ) ， 但 与 它 的 创建 
者 共享 全 局 变量 、 文 件 朱 述 符 、 信 号 处 理 函 数 和 当前 目录 状态 。 

线程 的 概念 已 经 出 现 一 段 时 间 了 ， 但 在 IEEE POSIX 委 员 会 发 布 有 
关 标 准 之 前 ， 它 们 并 没有 在 类 UNIX 操 作 系 统 中 得 到 广泛 支持 ， 而 且 已 
存在 的 线程 实现 版 本 也 因 厂 商 的 不 同 而 有 所 差异 。POSIX1003.1c 规 范 
的 发 布 改变 了 这 一 切 ， 线 程 不 仅 被 很 好 地 标准 化 了 ， 而 且 现 在 绝 大 多 
数 Linux 发 行 版 都 已 支持 它 。 现 在 ， 多 核 处 理 絮 即便 对 于 台式 机 也 已 非 
常 普 裔 ， 大 多 数 机 器 在 廉 层 人 硬件 上 就 已 物理 支持 了 同时 执行 多 个 线 
程 。 而 此 前 ， 对 于 单 核 CPU 来 说 ， 线 程 的 同时 执行 只 是 一 个 聪明 、 但 
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Linux 系 统 在 1996 年 第 一 次 获得 线程 的 支持 ， 我 们 常 把 当时 使 用 的 
函数 库 称 为 LinuxThread。LinuxThread 已 经 和 POSIX 的 标准 非常 接近 了 

(事实 上 ， 从 许多 方面 来 看 ， 它 们 之 前 的 区 别 并 不 明显 ) ， 它 是 在 
Linux 程 序 设计 中 迈 出 的 很 重要 的 一 步 ， 它 使 Linux 程 序 员 第 一 次 可 以 
在 Linux 系 统 中 使 用 线程 。 但 是 ， 在 Linux 的 线程 实现 版 本 和 POSIX 标 
准 之 则 还 是 存在 着 细微 的 差别 ， 最 明显 的 是 关于 信号 处 理 部 分 。 这 些 
中 的 大 部 分 都 受 压 层 Linux 内 核 的 限制 ， 而 不 是 函数 库 实现 所 强加 


许多 项 目 都 在 研究 如 何 才能 改善 Linux 对 线程 的 支持 ， 这 种 改善 不 
仅仅 是 清除 POSIX 标 准 和 Linux 有 具体 实现 之 间 的 细微 的 差别 ， 而 且 要 增 
强 Linux 线 程 的 性 能 和 删除 一 些 不 需要 的 限制 ， 其 中 大 部 分 工作 都 集中 
在 如 何 将 用 户 级 的 线程 映射 到 内 核 级 的 线程 。 在 这 些 项 目 中 有 两 个 主 
要 的 项 目 分 别 是 下 一 代 POSIX 线 程 (New Generation POSIX Thread, 
简写 为 NGPT) 和 本 地 POSIX 线 程 库 (Native POSIX Thread Library, 


简写 为 NPTL) 。 这 两 个 项 目 都 必须 修改 Linux 的 内 核 来 文 持 新 的 函数 
库 ， 与 日 的 Linux 线 程 相 比 ， 两 者 都 极 大 地 提升 了 性 能 。 

2002 年 ，NGPT 项 目 组 宣布 ， 由 于 他 们 不 希望 分 化 线程 团队 ， 所 
以 将 保 止 为 NGPT 添 加 新 功能 ， 而 只 是 继续 进行 Linux 上 的 线程 文 持 工 
作 ， 从 而 有 将 地 将 他 们 的 重担 放 到 了 NPTL 的 号 上 上。 因此， 很 明显 
NPTIL 将 成 为 Linux 线 程 的 新 标准 。 第 一 个 NPTL 的 主流 版 本 出 现在 Red 
Hat Linux 版 本 9 上 。 一 些 有 趣 的 天 于 NPTL 的 背景 资料 可 以 参考 文 
章 “Linux 上 的 本 地 POSIX 线 程 库 ” (The Native POSIX Thread Library for 
Linux) ， 该 文 的 作者 是 Ulrich Drepper 和 Ingo Molnar， 在 撰写 本 书 时 ， 
该 文 的 下 载 地 址 为 http://people.redhat.com/drepper/nptl-design.pdf ° 

本 章 中 的 大 部 分 代码 适用 于 任何 一 种 线程 库 ， 因 为 这 些 代码 是 基 
于 POSIX 标 准 的 ， 而 该 标准 普遍 适用 于 所 有 的 线程 库 。 但 是 ， 如 果 使 
用 的 是 旧 的 Linux 发 行 版 ， 你 将 看 到 一 些 细微 的 区 别 ， 特 别 是 用 ps 命令 
查看 本 章 示 例 程 序 的 运行 情况 时 。 


12.2 ”线程 的 优点 =I 


在 某 些 环境 下 ， 创 建新 线程 要 比 创建 新 进程 有 更 明显 的 优势 。 新 
线程 的 创建 代价 要 比 新 进程 小 得 多 (虽然 与 其 他 一 些 操 作 系 统 相 比 ， 
Linux 在 创建 新 进程 方面 的 效率 是 很 融 的 ) 。 下面 是 一 些 使 用 线程 的 优 


口 有 时 ， 让 程序 看 起 来 好 像 是 在 同时 做 两 件 事情 是 很 有 用 的 。 
一 个 经 典 的 例子 是 ， 在 编辑 文档 的 同时 对 文档 中 的 单词 个 数 进 行 
实时 统计 。 一 个 线程 负责 处 理 用 户 的 输入 并 执行 文本 编辑 工作 ， 
男 一 个 ( 它 也 可 以 看 到 相同 的 文档 内 容 ) 则 不 断 刷 新 单词 计数 变 
量 。 第 一 个 线程 (甚至 可 以 是 第 三 个 线程 ， 通 过 这 个 共享 的 计数 
变量 让 用 户 随时 了 解 自己 的 工作 进展 情况 。 男 一 个 例子 是 一 个 多 
线程 的 数据 库 服 务 器 ， 这 是 一 种 明显 的 单 进程 服务 多 用 户 的 情 
况 。 它 会 在 啊 应 一 些 请 求 的 同时 阻 窄 为 外 一 些 请 求 ， 使 之 等 待 磁 
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说 ， 这 个 明显 的 多 任务 工作 如 有 果 用 多 进程 的 方式 来 完成 将 很 难 做 
到 高 效 ， 因 为 各 个 不 同 的 进程 必须 紧密 合作 才能 满足 加 锁 和 数据 
二 性 性 方面 的 要 求 ， 而 用 多 线程 来 完成 承 比 用 多 进程 要 容易 得 
多 o 

口 一 个 混杂 着 输入 、 计 算 和 输出 的 应 用 程序 ， 可 以 将 这 几 个 音 
分 分 离 为 3 个 线程 来 执行 ， 从 而 改善 程序 执行 的 性 能 。 当 输入 或 输 
出 线程 等 待 连接 时 ， 另 外 一 个 线程 可 以 继续 执行 。 因 此 ， 如 采 一 
个 进程 在 任 一 时 刻 最 多 只 能 做 一 件 事 情 的 话 ， 线 程 可 以 让 它 在 等 
待 连接 之 类 的 事情 的 同时 做 一 些 其 他 有 用 的 事情 。 一 个 需要 同时 
处 理 多 个 网 络 连 搂 的 服务 器 应 用 程序 也 是 一 个 天 生 适 用 于 应 用 多 
线程 的 例子 。 

O 一般 而 言 ， 线 程 之 间 的 切换 需要 操作 系统 做 的 工作 要 比 进程 
之 间 的 切换 少 得 多 ， 因 此 多 个 线程 对 资源 的 需求 要 远 小 于 多 个 进 
程 。 如 果 一 个 程序 在 逻辑 上 需要 有 多 个 执行 线程 ， 那 么 在 单 处 理 
需 系 统 上 把 它 运 行为 一 个 多 线程 程序 才 更 符合 实际 情况 。 虽 然 如 
此 ， 编 写 一 个 多 线程 程序 的 设计 困难 较 大 ， 不 应 等 内 视 之 。 
线程 也 有 下 面 一 些 缺 点 。 

O 编写 多 线程 程序 需要 非常 仔细 的 设计 。 在 多 线程 程序 中 ， 
时 序 上 的 细微 偏差 或 无 意 造 成 的 变量 共享 而 引发 错误 的 可 能 性 是 
很 大 的 。Alan Cox (Linux 方 面 的 权威 ， 他 撰写 了 本 书 的 序 ) 曾经 
评论 线程 为 “如何 立 刻 让 目 己 目 讨 凋 号 。” 


D 对 多 线程 程序 的 调试 要 比 对 单线 程 程序 的 调试 困难 得 多 ， 
为 线程 之 间 的 交互 非常 难于 控制 。 

口 将 大 量 计算 分 成 两 个 部 分 ， 并 把 这 两 个 部 分 作为 两 个 不 同 的 
线程 来 运行 的 程序 在 一 台 单 处 理 器 机 器 上 并 不 一 定 运 行 得 更 快 ， 
除非 计算 确实 允许 它 的 不 同 部 分 可 以 被 同时 计算 ， 而 且 运 行 它 的 
机 器 拥有 多 个 处 理 右 核 来 支持 真正 的 多 处 理 。 


12.3 一 个 线程 程 


线程 有 一 套 完 整 的 与 其 有 关 的 函数 库 调 用 ， 它 们 中 的 绝 大 多 数 画 
数 名 都 以 pthread 开头。 为 了 使 用 这 些 函 数 库 调 用 ， 我 们 必须 定义 窗 
_REENTRANT， 在 程序 中 包含 头 文件 pthread.h， 并 且 在 编译 程序 时 需 
要 用 选项 -1pthread 来 链接 线程 库 。 

在 设计 最 初 的 UNIX 和 POSIX 库 例 程 时 ， 人 们 假设 每 个 进程 中 只 
一 个 执行 线程 。 一 个 明显 的 例子 就 是 ermo， 该 变量 用 于 获取 某 个 函数 
调用 失败 后 的 错误 信息 。 在 一 个 多 线程 程序 里 ， 默 认 情况 下 ， 只 有 一 
个 errno 变 量 供 所 有 的 线程 共享 。 在 一 个 线程 准备 获取 刚才 的 错误 代码 
上 时， 该 变量 很 容易 被 男 一 个 线程 中 的 函数 调用 所 改变 。 类 似 的 问题 还 
ee 这 些 函 数 通常 用 一 个 全 局 性 区 域 来 缓存 和 输 


为 解决 这 个 问题 ， 我 们 需要 使 用 被 称 为 可 重 入 的 例 程 。 可 重 入 代 
码 可 以 被 多 次 调用 而 仍然 正常 工作 ， 这 些 调 用 可 以 来 自 不 同 的 线程 ， 
也 可 以 是 某 种 形式 的 舱 套 调用 。 因 此 ， 代 码 中 的 可 重 入 部 分 通常 只 使 
用 局 部 变量 ， 这 使 得 每 次 对 该 代码 的 调用 都 将 获得 它 上 自己 的 唯一 的 一 
份 数 据 副 本 。 

编写 多 线程 程序 时 ， 我 们 通过 定义 宏 _REENTRANT 来 告诉 编译 虱 
我 们 需要 可 重 入 功能 ， 这 个 宏 的 定义 必须 位 于 程序 中 的 任何 #include 语 
句 之 前 。 它 将 为 我 们 做 3 件 事 情 ， 并 且 做 得 非常 优雅 ， 以 至 于 我 们 一 般 
不 需要 知道 它 到 底 做 了 哪些 事 。 

O 它 会 对 部 分 函数 重新 定义 它们 的 可 安全 重 入 的 版 本 ， 这 些 函 

数 的 名 字 一 般 不 会 发 生 改 变 ， 只 是 会 在 函数 名 后 面 添加 _r 字 人 符 
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O 在 ermo.h 中 定义 的 变量 ermo 现 在 将 成 为 一 个 函数 调用 ， 它 能 

够 以 一 种 多 线程 安全 的 方式 来 获取 真正 的 errmo 值 。 

在 程序 中 包含 头 文 件 pthread.h 还 将 加 我 们 提供 一 些 其 他 的 将 在 代 
码 中 使 用 到 的 定义 和 函数 原型 ， 就 如 同 头 文件 stdio.b 为 标准 输入 和 标 
准 输出 例 程 所 提供 的 定义 一 样 。 最 后 ， 需 要 确保 在 程序 中 包含 了 正确 
的 线程 头 文 件 ， 并 且 在 编译 程序 时 链接 了 实现 pthread 函 数 的 正确 的 线 
程 库 。 有 关 编 译 线程 程 序 的 更 详细 的 情况 将 在 下 面 的 实验 部 分 中 再 介 
绍 。 现 在 ， 我 们 首先 来 看 一 个 用 于 管理 线程 的 新 函数 pthread_create， 
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义 如 下 所 示 : 


#include <pthread.h> 


int pthread create(pthread t *thread, pthread attr 七 *attr, void 
*(*start routine)(void *), void *arg); 
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指 癌 pthread t 类 型 数据 的 指针 。 线 程 被 创建 时 ， 这 个 指针 指 癌 的 变量 
中 将 被 号 入 一 个 标识 符 ， 我 们 用 该 标识 符 来 引用 新 线程 。 下 一 个 参数 
用 于 设置 线程 的 属性 。 我 们 一 般 不 需要 特殊 的 属性 ， 所 以 只 需 设置 该 
参数 为 NULL。 我们 将 在 本 章 的 后 面 介绍 如 何 使 用 这 些 属性 。 最 后 两 
个 参数 分 别 告 诉 线程 将 要 启动 执行 的 函数 和 传递 给 该 男 数 的 参数 。 


void *(*start routine) (void *) 


上 上 面 一 行 告诉 我 们 必须 要 传递 一 个 函数 地 址 ， 该 男 数 以 一 个 指 同 
void 的 指针 为 参数 ， 返 回 的 也 是 一 个 指 同 void 的 指针 。 因 此 ， 可 以 传 
递 一 个 任 一 类 型 的 参数 并 返回 一 个 任 一 类 型 的 指针 。 用 fork 调 用 后 ， 
父子 进程 将 在 同一 位 置 继续 执行 下 去 ， 只 是 fork 调 用 的 返回 值 是 不 同 
的 ; 但 对 新 线程 来 说 ， 我 们 必须 明确 地 提供 给 它 一 个 函数 指针 ， 新 线 
程 将 在 这 个 新 位 置 开始 执行 。 

该 琅 数 调用 成 功 时 返回 值 是 0， 如 果 失 败 则 返回 错误 代码 。 手 册页 
人 


pthread_create 和 大 多 数 pthread_ 系列 函数 一 样 ， 在 失败 时 并 未 
遵循 UNIX 函 数 的 惯例 返回 -1， 这 种 情况 在 UNIX 函 数 中 属于 一 少 
部 分 。 所 以 除非 你 很 有 把 握 ， 在 对 错误 代码 进行 检查 之 前 一 定 要 
仔细 阅读 使 用 手册 中 的 有 关内 容 。 


线程 通过 调用 pthread_exit 函 数 终 止 执行 ， 就 如 同 进程 在 结束 时 调 
用 exit 函 数 一 样 。 这 个 函数 的 作用 是 ， 终 止 调用 它 的 线程 并 返回 一 个 指 
回 某 个 对 象 的 指针 。 注 意 ， 绝 不 能 用 它 来 返回 一 个 指 回 局 部 变量 的 指 
针 ， 因 为 线程 调用 该 函数 后 ， 这 个 局 部 变量 天 不 再 存在 了 ， 这 将 引起 
严重 的 程序 漏洞 。pthread_exit 函 数 的 定义 如 下 所 示 : 


finclude <pthread.h> 


void pthread exit(void "retval); 


pthread_join 函 数 在 线程 中 的 作用 等 价 于 进程 中 用 来 收集 子 进程 信 
息 的 wait 函 数 。 这 个 函数 的 定义 如 下 所 示 : 


int pthread_join(pthread_t th, void **thread return]; 


第 一 个 参 : BUR CHEN 待 的 线程 ， 线 程 通过 pthread_create 返 回 
的 标识 符 来 指定 二 个 参数 是 一 个 指针 它 指 癌 男 一 个 指针 ， 而 后 
省 指向 线程 的 瓜 回 值 与 pthread_create 类 似 ， 这 个 函数 在 成 功 时 返回 
0， 失 败 时 返回 错误 代码 。 


sx 验 一 个 简单 的 线程 程序 

这 个 程序 创建 一 个 新 线程 ， 新 线程 与 原先 的 线程 共享 变量 ， 并 在 
结束 时 间 原 先 的 线程 返回 一 个 结果 。 没 有 比 这 更 简单 的 多 线程 程序 
T! 下 面 是 程序 thread1.c 的 代码 : 


Sinclude «string.? 


(1) 编译 这 个 程序 时 ， 我 们 首先 需要 定义 宏 _REENTRANT。 在 
少数 系统 上 ， 可 能 还 需要 定义 宏 _ POSIX_C_SOURCE， 但 一 般 不 需要 


定义 它 。 


(2) 接 下 来 必须 链接 正确 的 线程 库 。 如 果 使 用 的 是 一 个 老 的 
Linux 发 行 版 ， 默 认 的 线程 库 不 是 NPTL， 你 可 能 需要 升级 Linux 发 行 
版 ， 尽 管 本 章 中 的 大 多 数 代 码 也 兼容 老 的 Linux 线 程 实现 。 简 单 的 检查 
方法 是 查看 头 文 件 /usvinclude/pthread.h。 如 果 这 个 文件 中 显示 的 版 权 
日 期 是 2003 年 或 更 晚 ， 那 几乎 可 以 肯定 你 的 Linux 发 行 版 使 用 的 是 
NPTL 实 现 。 如 果 日 期 比 这 个 早 ， 你 可 能 束 需 要 安装 一 个 较 新 版 本 的 
Linux J ° 

(3) 在 验证 并 安装 了 正确 的 文件 后 ， 现 在 可 以 编译 和 链接 这 个 程 
序 了 ， 使 用 的 命令 如 下 所 示 : 


cc -D_REENTRANT -I/usr/include/nptl threadl.c 
-0 threadl -L/usr/lib/nptl -ipthread 


如 果 你 的 系统 默认 使 用 的 〈 很 有 可 能 ) 就 是 NPTL 线 程 库 ， 那 
么 编译 程序 时 就 无 需 加 上 -I 和 -L 选 项 。 使 用 的 命令 如 下 所 示 : 


$ cc -D REENTRANT threadi.c -o threadi -lpthread 


我 们 将 在 本 章 中 一 直 使 用 这 一 简单 版 本 的 命令 行 。 
(4) 运行 这 个 程序 时 ， 你 将 看 到 : 


$ ./thread1l 
Waiting for thread to finish... 
thread_function is running. Argument was Hello World 
Thread joined, it returned Thank you for the CPU time 
Message is now Bye! 

这 个 程序 值得 我 们 花 一 点 时 间 去 理解 ， 因 为 它 是 本 章 中 大 多 数 例 

J 基础 ? 

实验 解析 


首先 ， 我 们 定义 了 在 创建 线程 时 需要 由 它 调 用 的 一 个 函数 的 原 
型 。 如 下 所 示 : 


void *thread function(void *arg); 


TR Hi pthread_createH 2K, ERAS TRIS] void hy RET TENE 
数 ， 返 回 的 也 是 指 癌 void 的 指针 。 稍 后 ， 我 们 将 介绍 这 个 函数 的 实 
现 。 

在 main 函数 中 ， 我 们 首先 定义 了 几 个 变量 ， 然 后 调用 
pthread_create 开 始 运行 新 线程 。 如 下 所 示 : 


FRA] IA] pthread_create KZE E T — ^T pthread. t2S W XF RAY HHL , 
今后 可 以 用 它 来 引用 这 个 新 线程 。 我 们 不 想 改 变 默 认 的 线程 属性 ， 所 
以 设置 第 二 个 参数 为 NULL。 最 后 两 个 参数 分 别 为 将 要 调用 的 贸 数 和 
一 个 传递 给 该 函数 的 参数 。 

如 果 这 个 调用 成 功 了 ， 就 会 有 两 个 线程 在 运行 。 原 先 的 线程 

(main) 继续 执行 pthread_create 后 面 的 代码 ， 而 新 线程 开始 执行 
thread_function 函 数 。 
d EIS GUNNIE Val FA pthread. join ER Zi , 
H 不 : 


res = pthread_join(a_thread, &thread result); 


我 们 给 该 函数 传递 两 个 参数 ， 一 个 是 正在 等 待 其 结束 的 线程 的 标 
识 符 ， 另 一 个 是 指 癌 线程 返回 值 的 指针 。 这 个 函数 将 等 到 它 所 指定 的 
线程 终止 后 才 返 回 。 然 后 主线 程 将 打印 新 线程 的 返回 值 和 全 局 变量 
message 的 值 ， 最 后 退出 。 

狐 线 程 在 thread_function 范 数 中 开始 执行 ， 它 先 打印 出 自己 的 参 
数 ， 休 有 眠 一 会 儿 ， 然 后 更 新 全 局 变量 ， 最 后 退出 并 疝 主 线程 返回 一 个 
字符 串 。 新 线程 修改 了 数组 message， 而 原先 的 线程 也 可 以 访问 该 数 
o 如果 我 们 调用 的 是 fork 而 不 是 pthread_create， 就 不 会 有 这 样 的 效 


12.4 ”同时 执行 


授 下 来 ， 我 们 将 编写 一 个 程序 来 验证 两 个 线程 的 执行 是 同时 进行 
的 (当然 ， 如 果 是 在 一 个 单 处 理 絮 系统 上 ， 线 程 的 同时 执行 就 需要 靠 
CPU 在 线程 之 间 的 快速 切换 来 实现 ) 。 因 为 还 未 介绍 到 任何 可 以 帮助 
我 们 有 效 地 完成 这 一 工作 的 线程 同步 函数 ， 在 这 个 程序 中 我 们 是 在 两 
个 线程 之 间 使 用 轮 询 技术 ， 所 以 它 的 效率 很 低 。 同 时 ， 我 们 的 程序 仍 
然 要 利用 这 一 事实 ， 即 除 局 部 变量 外 ， 所 有 其 他 变量 都 将 在 一 个 进程 
中 的 所 有 线程 之 间 共享 。 


Sc 验 两 个 线程 同时 执行 

在 本 蔬 中 ， 我 们 创建 的 程序 thread2.c 是 在 对 thread1.c 稍 加 修改 的 基 
础 上 编写 出 来 的 。 我 们 增加 了 另外 一 个 文件 范围 变量 来 测试 哪个 线程 
正在 运行 。 如 下 所 示 : 


程序 的 完整 代码 可 以 在 本 书 的 网 站 上 下 载 。 


int run now = 1; 


我 们 将 在 执行 main 函 数 时 把 run_now 设 置 为 1， 在 执行 新 线程 时 将 
其 设置 为 2 


main 数 中 ， 我 们 在 创建 新 线程 的 语句 之 后 添加 下 面 的 代码 


如 果 run_now 的 值 为 1， 束 打印 “1? 并 设置 它 为 >， 否则 ， 残 稍 做 休 
息 然 后 再 检查 它 的 值 。 我 们 不 断 地 检查 来 等 竺 它 的 值 变 为 1， 这 种 方式 
被 称 为 忙 等 待 ， 虽然 已 经 在 两 次 检查 之 间 休 息 1 秒 钟 来 减 慢 检 查 的 频率 
了 。 在 本 章 的 后 面 我 们 将 看 到 对 这 一 问题 的 一 个 更 好 的 解决 方法 。 

在 新 线程 执行 的 thread_function 函 数 中 ， 我 们 所 做 的 事情 和 上 面 的 
大 部 分 都 相同 ， 只 是 把 run_now 的 值 颠倒 了 一 下 。 如 下 所 示 : 


" Cee ieee 因为 现在 我 们 不 再 需 
Ae 

运行 这 个 程序 时 ， 将 看 到 如 下 所 示 的 输出 结果 〈 你 可 能 会 发 现 程 
序 要 过 几 秒 钟 才 会 产生 和 输出， 特别 是 在 一 个 单 核 CPU 的 机 器 上 ) 。 


$ cc -D REENTRANT thread2.c -o thread2 -lpthread 


$ ./thread2 
12121212121212121212 
Waiting for thread to finish... 


Thread joined 


实验 解析 

每 个 线程 通过 设置 run_now 变 量 的 方法 来 通知 另 一 个 线程 开始 运 
行 ， 然 后 ， 它 会 等 待 另 一 个 线程 改变 了 这 个 变量 的 值 后 再 次 运行 。 这 
个 例子 显示 了 两 个 线程 之 间 目 动 交 蕉 执行 ， 同 时 也 再 次 阐明 了 一 个 观 


点 ， 即 这 两 个 线程 共享 run_now 变 量 。 


12.5 ”同步 


在 上 一 市 中 ， 我 们 看 到 两 个 线程 同时 执行 的 情况 ， 但 我 们 采用 的 
在 它们 之 间 进 行 切 换 的 方法 古 非 常 浴 拙 且 没 有 效率 的 。 幸 运 的 是 ， 专 
门 有 一 组 设计 好 的 函数 为 我 们 提供 了 更 好 的 控制 线程 执行 和 访问 代码 
临界 区 域 的 方法 。 

我 们 将 在 本 节 学 习 两 种 基本 的 方法 。 一 种 是 信号 量 ， 它 的 作用 如 
同 看 守 一 段 代码 的 看 门人 ; 男 一 种 是 互 不 量 ， 它 的 作用 如 同 保护 代码 
段 的 一 个 互 不 设备 。 这 两 种 方法 很 相似 ， 事 实 上 ， 它 们 可 以 互相 通过 
对 方 来 实现 。 但 在 实际 应 用 中 ， 对 于 一 些 情况 ， 可 能 使 用 信号 量 或 互 
不 量 中 的 一 个 更 符合 问题 的 语义 ， 并 且 戏 果 更 好 。 例 如 ， 如 末 想 控制 
任 一 时 刻 只 能 有 一 个 线程 可 以 访问 一 些 共 至 内 存 ， 使 用 互 不 量 束 要 目 
然 得 多 。 但 在 控制 对 一 组 相同 对 象 的 访问 时 一 一 比如 从 5 条 可 用 的 电话 
线 中 分 配 1 条 给 某 个 线程 的 情况 ， 殊 更 适合 使 用 计数 信号 量 。 具 体 选 择 
哪 种 方法 取决 于 个 人 偏好 和 相应 的 程序 机 制 。 


有 两 组 接口 函数 用 于 信号 量 。 一 组 取 目 POSIX 的 实时 扩展 ， 用 于 
线程 。 男 一 组 个 称 为 系统 V 信 号 量 ， 常 用 于 进程 的 同步 (我 们 将 在 第 
14 章 介绍 第 二 组 接口 函数 ) 。 这 两 组 接口 函数 虽然 很 相近 ， 但 并 不 保 
证 它们 之 间 可 以 互 换 ， 而 且 它 们 使 用 的 函数 调用 也 各 不 相同 。 

何 兰 计算 机 科学 家 Dijkstra 首 和 提出 了 信和 号 量 的 概念 。 信 号 量 是 一 
个 特殊 类 型 的 变量 ， 它 可 以 被 增加 或 减少 ， 但 对 其 的 关键 访问 被 保证 
征 原 子 操作 ， 即 使 在 一 个 多 线程 程序 中 也 是 如 此 。 这 意味 着 如 条 一 个 
程序 中 有 两 个 (或 更 多 ) 的 线程 试图 改变 一 个 信号 量 的 值 ， 系 统 将 保 
证 所 有 的 操作 都 将 依次 进行 。 但 如 果 十 普通 变量 ， 来 目 同一 程序 中 的 
不 同 线程 的 冲突 操作 所 导致 的 结 采 将 是 不 确定 的 。 

在 本 证 中， 我 们 将 介绍 一 种 最 简单 的 信号 量 一 一 二 进 制 信号 量 ， 
它 只 有 0 和 1 两 种 取 值 。 还 有 一 种 更 通用 的 信号 量 一 一 计数 信号 量 ， 它 
可 以 有 更 大 的 取 值 范围 。 信 号 量 一 般 常 用 来 保 扩 一 段 代 码 ， 使 其 每 次 
只 能 被 一 个 执行 线程 运行 ， 要 完成 这 个 工作 ， 束 要 使 用 二 进 制 信号 
量 。 有 时 ， 我 们 希望 可 以 允许 有 限 数目 的 线程 执行 一 段 指 定 的 代码 ， 
这 束 需 要 用 到 计数 信号 量 。 由 于 计数 信和 号 量 并 不 常用 ， 所 以 我 们 在 这 


里 不 对 它 进 行 深 入 的 介绍 ， 实 际 上 它 仅仅 是 二 进 制 信号 量 的 一 种 逻辑 
扩展 ， 两 者 实际 调用 的 函数 都 一 样 。 

信号 量 函 数 的 名 字 都 以 sem_ 开 头 ， 而 不 像 大 多 数 线程 男 数 那样 以 
o 线程 中 使 用 的 基本 信号 量 画 数 有 4 个 ， 它 们 都 非常 的 简 


信号 量 通过 sem_init 函 数 创建 ， 它 的 定义 如 下 所 示 : 


#include <semaphore.h> 


int sem init(sem t *sem, int pshared, unsigned int value); 
这 个 函数 初始 化 由 sem 指 向 的 信号 量 对 象 ， 设 置 它 的 共 至 和 碗 项 
(我 们 马上 就 会 介绍 到 它 ) ， 并 给 它 一 个 初始 的 整数 值 。pshared 参 数 
控制 信号 量 的 类 型 ， 如 果 其 值 为 0， 束 表示 这 个 信号 量 是 当前 进程 的 局 
部 信号 量 ， 否 则 ， 这 个 信和 号 量 束 可 以 在 多 个 进程 之 间 共 对。 我 们 在 这 
里 只 对 不 能 在 进程 间 共 享 的 信号 量 感 兴趣 。 在 编写 本 书 时 ，Linux 还 不 
文 持 这 种 共享 ， 给 pshared 参 数 传 递 一 个 非 零 值 将 导致 调用 失败 。 
接 下 来 的 两 个 函数 控制 信号 量 的 值 ， 它 们 的 定义 如 下 所 示 : 


#include <semaphore.h> 


int sem wait(sem t * sem); 


int sem post(sem t * sem); 


PY TRB MSH ABA, VABTHBISIBUS E A sem_init 
调用 初始 化 的 信号 量 。 

sem_post 数 的 作用 是 以 原子 操作 的 方式 给 信号 量 的 值 加 1。 所 谓 
原子 操作 是 指 ， 如 有 果 两 个 线程 企图 同时 给 一 个 信号 量 加 1， 它 们 之 间 不 
会 互相 干扰 ， 而 不 像 如 果 两 个 程序 同时 对 同一 个 文件 进行 读 取 、 增 
加 、 写 入 操作 时 可 能 会 引起 冲突 。 信 号 量 的 值 总 是 会 补正 确 地 加 2， 
为 有 两 个 线程 试图 改变 它 。 

sem_wait 函 数 以 原子 操作 的 方式 将 信号 量 的 值 减 1， 但 它 会 等 待 直 
到 信号 量 有 个 非 零 值 才 会 开始 减法 操作 。 因 此 ， 如 采 对 值 为 2 的 信号 量 
调用 sem_wait， 线 程 将 继续 执行 ， 但 信号 量 的 值 会 城 到 1。 如 果 对 值 为 
0 的 信号 量 调用 sem_wait， 这 个 函数 束 会 等 待 ， 直 到 有 其 他 线程 增加 了 
该 信号 量 的 值 使 其 不 再 是 0 为 止 。 如 果 两 个 线程 同时 在 sem_wait 调 用 上 
等 竺 同一 个 信号 量变 为 非 零 值 ， 那 么 当 该 信号 量 被 第 三 个 线程 增加 1 
时 ， 只 有 其 中 一 个 等 待 线程 将 开始 对 信和 号 量 减 1， 然 后 继续 执行 ， 另 外 


一 个 线程 还 将 继续 ° 信 号 量 的 这 种 “在 单个 范 数 中 束 能 原子 化 地 进 
行 测试 和 设置 ”的 INA 得 非常 有 价值 。 


还 有 另外 一 个 信号 量 函 数 sem ywalt, 它 是 sem_wait 的 非 阻 
塞 版 本 。 我 们 不 在 这 里 对 它 做 更 多 的 介绍 ， 更 详细 的 资料 可 以 参 
考 它 的 手册 页 o 


最 后 一 个 信号 量 本 数 是 sem_destroy。 这 个 函数 的 作用 是 ， 用 完 信 
号 量 后 对 它 进 行 清理 。 它 的 定义 如 下 : 
#include <semaphore.h> 


int sem destroy(sem t * sem); 

与 前 儿 个 函数 一 样 ， 这 个 函数 也 以 一 个 信号 量 指针 为 参数 ， 并 清 
理 该 信号 量 拥有 的 所 有 资源 。 如 果 企 图 清理 的 信号 量 正 被 一 些 线程 等 
待 ， 就 会 收 到 一 个 错误 。 

与 大 多 数 Linux 函 数 一 样 ， 这 些 函 数 在 成 功 时 都 返回 0。 


x 验 一 个 线程 信号 量 
这 个 程序 thread3.c 也 是 基于 thread1.c 的 。 因 为 改动 的 地 方 比较 多 ， 
所 以 我 们 将 其 完整 代码 列 在 下 面 。 


finclude <stdio.h> 
#include <unistd.h> 


#include <stdlib.h> 
#include <string.h> 
$include «pthread.h» 
finclude «semaphore.h» 
thread n d *arg 
em bin sem 
$define WORK SIZE 2 
har wc area[WOR IZE 


JUL read fu 1 LL 
ed" 
2 { 
Ẹ T 
printf|*wnWaiting for thread to finish n 
res = pthread join|a thread, &thread result|; 
f {res {= 
perror( "Thread ec") 
ex EXIT_FAILURE 
"Thread lt i 
sem destroy (sb 
exit [EXIT, SUCCESS) ; 
hread funct ] r 
zem t (&bir 
whileistrnemp(*end*. work area, 3) { 
printf[(*You input td characters\n", strlen(work.area) -1) 
em waiti& gem) : 


pthread exi 


Te aoe AL 舍 了 头 文件 semaphore， h， 它 使 我 们 可 以 访 
问 信 号 量 函 数 。 人 然后， 定义 一 个 信号 量 和 几 个 变量 ， 并 在 创建 渐 线 程 
之 前 对 信 言 号 量 进行 初始 化 。 如 下 所 示 : 


sem_t bin_sem; 


#define WORK SIZE 1024 
char work area[WORK. SIZE]; 


int main() { 
int res; 
pthread_t a_threa 
void *thread result; 
res = sem init(&bin sem, 0, 0}; 
if (res != d { 
("Semaphore initialization failed"); 


exit (EX IT FAILURE); 


1 


j 


主意 ， 我 们 将 这 个 信号 量 的 初始 值 设置 为 0。 
RA 启动 新 线程 后 我 们 从 键盘 读 取 一 些 文本 并 把 它 
pens area 数 组 中 ， 然 后 调用 sem_post 增 加 信号 量 的 值 。 
UR Ata: 


princi out some Enter inis 
hileí(strncmp("end work ea 

tae WOrk area I IZE 1 

em r t(&bin sem 


在 新 线程 中 ， 我 们 等 待 信号 量 ， 然 后 统计 来 自 和 输入 的 字符 个 数 。 
如 下 所 示 : 


Jg 


i(&bin sem); 


设置 信号 量 的 同时 ， 我 们 等 竺 厦 键盘 的 输入 。 当 输入 到 达 时 ， 我 
们 释放 信号 量 ， 允 许 第 二 个 线程 在 第 一 个 线程 再 次 读 取 键盘 输入 之 前 
统计 出 输入 字符 的 个 数 。 

这 两 个 线程 共享 同一 个 work_area 数 组 。 为 了 让 示例 代码 更 加 简洁 
并 容易 理解 ， 我 们 还 省 略 了 一 些 错误 检查 。 例 如 ， 没 有 检查 sem_wait 
玉 数 的 返回 值 。 但 在 产品 代码 中 ， 除 非 有 特别 充足 的 理由 才 省 略 错误 
检查 ， 否 则 我 们 总 是 应 该 检查 函数 的 返回 值 。 

运行 这 个 程序 : 

> ./thread3 


t Enter ‘end’ t 


Waiting for thread to finish 


在 线程 程序 中 ， 时 序 错误 查找 起 来 总 是 特 别 困难 ， 但 这 个 程序 似 
乎 对 快速 的 文本 输入 和 悠闲 的 暂停 都 很 适应 。 

实验 解析 

切 始 化 信号 量 时 ， 我 们 把 它 的 值 设 置 为 0。 这 样 ， 在 线程 贸 数 局 动 
时 ，sem_wait 画 数 调 用 就 会 阻塞 并 等 得 信和 与 量变 为 非 零 值 。 

在 主线 程 中 ， 我 们 等 待 直到 有 文本 输入 ， 然 后 调用 sem_post 增 加 
信号 量 的 值 ， 这 将 立刻 令 另 一 个 线程 从 sem_wait 的 等 待 中 返回 并 开始 
执行 。 在 统计 完 字 符 个 数 之 后 ， 它 再 次 调用 sem_wait 并 再 次 被 阻塞 ， 
直到 主线 程 再 次 调用 sem_post 增 加 信和 号 量 的 值 为 止 。 

我 们 很 容易 忽略 程序 设计 上 的 细微 错误 ， 而 该 错误 会 导致 程序 运 
行 结 采 中 的 一 些 细微 错误 。 我 们 将 上 面 的 程序 稍 加 修改 并 另存 为 


thread3a.c。 它 偶尔 会 将 来 目 键 弄 的 输入 用 事先 准备 好 的 文本 目 动 奉 换 
掉 。 我 们 把 main 函 数 中 的 读数 据 循环 修改 为 : 


I i nd work area j 
I piwork area, "FAST" ` 


em. post {bin sem) 


统计 线程 开 
行情 况 如 下 


现在 ， 如 采 输 入 FAST， 程序 误会 调用 sem_post 使 字符 
， 同 时 立刻 用 其 他 数据 更 新 work_area 数 组 。 程 序 运 
Zh: 


5 cc -D REENTRANT thread3a.c -O thread3a -iptnreaa 
* ./thread3a 
Input some text 


问题 在 于 ， 我 们 的 程序 依赖 其 接收 文本 输入 的 时 间 要 足够 长 ， 这 
样 男 一 个 线程 才 有 时 间 在 主线 程 还 未 准备 好 给 它 更 多 的 单词 去 统计 之 
前 统计 出 工作 区 中 字符 的 个 数 。 当 我 们 试图 连续 快速 地 给 它 两 组 不 同 
的 单词 去 统计 时 (键盘 输入 的 FAST 和 程序 自动 提供 的 Weeee...) ， 第 
二 个 线程 束 没 有 时 间 去 执行 。 但 信和 号 量 已 被 增加 了 不 止 一 次 ， 所 以 字 
eae void 并 减少 信号 量 的 值 ， 直 到 它 再 次 变 
S 

这 个 例子 显示 : 在 多 线程 程序 中 ， 我 们 需要 对 时 序 考虑 得 非常 仔 


细 。 为 了 解决 上 面 程序 中 的 问题 ， 我 们 可 以 再 增加 一 个 信号 量 ， 让 主 
线程 等 到 统计 线程 完成 字符 个 数 的 统计 后 再 继续 执行 ， 但 更 简单 的 一 
种 方式 是 使 用 互 不 量 。 


男 一 种 用 在 多 线程 程序 中 的 同步 访问 方法 是 使 用 互 不 量 。 它 允许 
程序 员 锁 住 某 个 对 象 ， 使 得 每 次 只 能 有 一 个 线程 访问 它 。 为 了 控制 对 


天 键 代 码 的 访问 ， 必 须 在 进入 这 段 代 码 之 前 锁 住 一 个 互 斥 量 ， 然 后 在 
完成 操作 之 后 解锁 它 。 

用 于 互 斥 量 的 基本 函数 和 用 于 信号 量 的 函数 非常 相似 ， 它 们 的 定 
区 如 下 所 未 : 


include «ptnread.n» 


int pthread mutex init(pthread mutex t *mutex, const pthread_mutexattr_t 
*mutexattr); 


与 其 他 函数 一 样 ， 成 功 时 返回 0， 失 败 时 将 返回 错误 代码 ， 但 这 些 
函数 并 不 设置 errno， 你 必须 对 函数 的 返回 代码 进行 检查 。 

与 信号 量 类 似 ， 这 些 函 数 的 参数 都 是 一 个 先前 声明 过 的 对 象 的 指 
针 。 对 互 斥 量 来 说 ， 这 个 对 象 的 类 型 为 pthread_ mutex t ° 
pthread_mnutex_init 函 数 中 的 属性 参数 允许 我 们 设置 互 斥 量 的 属性 ， 而 
属性 控制 着 互 斥 量 的 行为 。 属 性 类 型 默认 为 fast， 但 它 有 一 个 小 缺点 : 
如 果 程 序 试图 对 一 个 已 经 加 了 锁 的 互 斥 量 调用 pthread_mnutex lock， 程 
序 聊 会 被 阻 赛 ， 而 又 因为 拥有 互 斥 量 的 这 个 线程 正 是 现在 被 阻塞 的 线 
程 ， 所 以 互 不 量 就 永远 也 不 会 被 解锁 了 ， 程 序 也 就 进入 死 锁 状 态 。 这 
个 问题 可 以 通过 改变 互 不 量 的 属性 来 解决 ， 我 们 可 以 让 它 检查 这 种 情 
况 并 返回 一 个 错误 ， 或 者 让 它 递归 的 操作 ， 给 同一 个 线程 加 上 多 个 
锁 ， 但 必须 注意 在 后 面 执行 同等 数量 的 解锁 操作 。 

设置 互 斥 量 的 属性 超出 了 本 书 的 讨论 范围 ， 所 以 我 们 将 传递 
NULL 给 属性 指针 ， 从 而 使 用 其 默认 行为 。 与 改变 属性 相关 的 更 详细 
的 资料 可 以 参考 pthread_mnutex_init 的 手册 页 。 


X 验 线程 互 不 量 

这 个 程序 也 基于 原先 的 thread1.c， 但 改动 的 地 方 比 较 多 。 这 次 ， 
假设 需要 保护 对 一 些 天 键 变量 的 访问 ， 我 们 用 一 个 互 不 量 来 保证 任 一 
时 刻 只 能 有 一 个 线程 访问 它们 。 为 了 让 示例 代码 容易 阅读 ， 我 们 省 略 
了 对 互 斤 量 加 锁 和 解锁 调用 的 返回 值 应 该 进行 的 一 些 错误 检查 。 在 软 
OR 对 返回 值 的 检查 是 必 不 可 少 的 。 下 面 是 新 程 序 thread4.c 的 


finclude «stdio.h» 
Sinclode <unistd.h> 
Sinclude <stdlib.h> 
finclude <string.h> 
finclude «pthread.h» 
finclude <semaphore.h> 


void *thread function(void *arg); i 
pthread mutex t work mutex; /* protects both work area and time to exit */ 


(define WORX SIZE 1024 
char work area[WORK SIZE]: 
int time to exit - 0; 


int maini) { 
int res; 
pthread t à thread; 
void *thread result: 
res = pthread mutex init(&work mutex, NULL); 
if (rem t= 0) ( 
perror(*Mutex initialization failed*]; 
exit(EXIT, FAILURE) 
} 
res = pthread_createiéa_thread, NULL, thread function, NULL); 
if fres t= 0) ( 
perror{*Thread creation failed’); 
exit (EXIT_FAILUEE); 
) 
pthread mutex lock(&work mutex); 
printf(*Input some text. Enter 'end' to finishin"); 
while|!time to exit) ( ] 
fgets(work area. WORK SIZE, stdin}; 
prhread mutex unlock(&work mutex); 
whileill! ( 


) 


pthread mutex lock | &work_mutex) ; 
if (work_area[G] t= *\0") ( 
pthread mutex unlock (Swork mutex) ; 
Bleep (1); 
) 
else ( 
break; 
) 
) 
) 
pthread putex unlock|[&work mutex); 
printf(*inWaiting for thread to finish...\n*); 
res = pthresd jcín(a thread, &thresj result]: 
if [res t= 0) 4 
perror('Thread join failed"): 
exit|EXIT FAILURE): 
) 
printf(*Thread jcined'in*); 
pthread mutex, destroy (&work mutex!) ; 
exit(EXIT, SUCCESS!) ; 


void ‘thread functiíon(void *arg) ( 


“oe 


sleep(í1); 
pthread mutex lock(&work mutex) + 
while(strncmp('*end', work area, 3) != 0) | 
printf(*You input td charactersin*, strlen(work area) -1!; 
work area[0] = 0; 
pthread mutex unlock|&work mutex); 
szleepí1l: 
pthread mutex lock(&work mutex): 
while (work ares[0] «= ‘\O0' ) { 
pthread mutex unlock[&work mutex]; 
sleepi1]; 
pthread mutex lock!&work mutex); 
) 
] 
time to exit = 1; 
work .area[0] = '\0'} 
pthread mutex unlock(&work mutex); 
pthread, exit (0); 


ce -D REENTRANT thread4.c -o thread4 -Ipthread 
./thread4 


Input some text. Enter ‘end’ to finish 
Whit 

You input 4 characters 

The Crow Road 

You input 13 characters 

end 


Waiting for thread to finiah,. 
Thread joined 


实验 解析 


在 程序 的 开始 ， 我 们 声明 了 一 个 互 斥 量 、 工 作 区 和 一 个 变 


time to_exit。 如 下 所 示 : 


#define WORK_SIZE 1024 


char work area[WORK SIZE]; 


int time to exit - O0; 


E 


E 


后 初始 化 互 不 量 
然后 初始 人 =, 
res = prnread mutex init|kwOrKk mutex, NULL); 
if (res i= 


er Mutex tialization faile 
exit (EXIT_FAILURE 


fe PORJESEUEEEAE o PE EERIE a PUT RIT VES: 


strlen(work area 


york area 


渐 线 程 首先 试图 对 互 斥 量 加 锁 。 如 果 它 已 经 被 锁 住 ， 这 个 调用 将 
被 阻塞 直到 它 被 释放 为 止 。 一 旦 获得 访问 权 ， 我 们 就 检查 是 否 有 申请 
退出 程序 的 请 求 。 如 果 有 ， 束 设置 time to_exit 变 量 ， 再 把 工作 区 的 第 
一 个 字符 设置 为 0， 然 后 退出 。 

如 果 不 想 退 出 ， 就 统计 字符 个 数 ， 然 后 把 work_area 数 组 中 的 第 一 
个 字符 设置 为 null。 我们 用 将 第 一 个 字符 设置 为 mull 的 方法 通知 读 取 输 
入 的 线程 ， 我 们 已 完成 了 字符 统计 。 然 后 解锁 互 斥 量 并 等 竺 主线 程 继 
续 运 行 。 我 们 将 周期 性 地 壬 斌 给 互 不 量 加 锁 ， 如 果 加 锁 成 功 ， 就 检查 
是 否 主线 程 义 有 字符 送 来 要 人 处理 。 如 果 还 没有 ， 就 解锁 互 不 量 继续 等 
待 ， 如 果 有 ， 束 统计 字符 个 数 并 再 次 进入 循环 。 

下 面 是 主线 程 的 代码 : 


pthread_mutex_lock({&work_mutex) ; 
r f t me tex Ente end nish\n 
while ime to exi 

_area RK_SIZE, stdi 

ead mutex unl rk mutex) 
t ad mutex C oe rx mu x 
k area \0! ( 
上 id mu unlock (&wor mutex 


} 
pthread mutex unlock(&work mutex); 
这 上段 代码 和 上 面 新 线程 中 的 很 类 似 。 我 们 首先 给 工作 区 加 锁 ， 读 
入 文本 到 它 里 面 ， 然 后 解锁 以 允许 其 他 线程 访问 它 并 统计 字符 数目 。 
我 们 周期 性 地 对 互 不 量 再 加 锁 ， 检 查 字 符 数 目 是 否 已 统计 完 
(work_area[0] 被 设置 为 null) 。 如 果 还 需要 等 待 ， 就 释放 互 斥 量 。 如 
前 所 述 ， 这 种 通过 轮 询 来 获得 结果 的 方法 通常 并 不 是 好 的 编程 方式 。 
在 实际 的 编程 中 ， 我 们 应 该 尽 可 能 用 信号 量 来 避免 出 现 这 种 情况 。 这 
里 的 代码 只 是 用 作 示 例 而 已 。 


12.6 ”线程 的 属 ' 


在 第 一 次 介绍 创建 线程 的 函数 时 ， 我 们 并 未 讨论 更 高 级 的 线程 属 
性 问题 。 现 在 我 们 已 介绍 完了 同步 线程 的 主题 ， 可 以 回头 来 看 这 些 线 
程 目 身 的 更 高 级 特性 了 。 我 们 可 以 控制 的 线程 属性 非常 多 ， 但 在 这 里 
ne 其 他 属性 的 详细 资料 可 以 在 手册 
页 中 找到 。 

在 前 面 的 所 有 程序 示例 中 ， 我 们 都 在 程序 退出 之 前 用 pthread_join 
对 线程 再 次 进行 同步 ， 如 果 我 们 想 让 线程 癌 创建 它 的 线程 返回 数据 束 
需要 这 样 做 。 但 有 时 也 会 有 这 种 情况 ， 我 们 既 不 需要 第 二 个 线程 同 主 
线程 返回 信息 ， 也 不 想 让 主线 程 等 竺 它 的 结束 。 

假设 我 们 在 主线 程 继 续 为 用 户 提供 服务 的 同时 创建 了 第 二 个 线 
程 ， 新 线程 的 作用 是 将 用 户 正 在 编辑 的 数据 文件 进行 备份 存储 。 备 份 
工作 结束 后 ， 第 二 个 线程 就 可 以 直接 终止 了 ， 它 没有 必要 再 回 到 主线 


程 中 。 

我 们 可 以 创建 这 一 类 型 的 线程 ， 它 们 被 称 为 脱离 线程 (detached 
thread) 。 可 以 通过 修改 线程 属性 或 调用 pthread_ detach 的 方法 来 创建 
EI eng 目的 是 介绍 线程 的 属性 ， 所 以 在 这 里 我 们 就 使 用 前 
a 1 5 

需要 用 到 的 最 重要 的 函数 是 pthread_attr_init， 它 的 作用 是 初始 化 
一 个 线程 属性 对 象 。 


#include <pthread.h> 


int pthread attr init(pthread attr t *attr); 


与 前 面 的 函数 一 样 ， 它 在 成 功 时 返回 0， 失 败 时 返回 错误 代码 。 

还 有 一 个 回收 画 数 pthread_attr_destroy， 它 的 目的 是 对 属性 对 象 进 
行 清理 和 回收 。 一 旦 对 象 被 回收 了 ， 除 非 它 被 重新 初始 化 ， 否 则 就 不 
能 被 再 次 使 用 。 

初始 化 一 个 线程 属性 对 象 后 ， 我 们 可 以 调用 许多 其 他 的 函数 来 设 
置 不 同 的 属性 行为 我 们 把 其 中 主要 的 一 些 函 数列 在 下 面 (完整 的 列 
表 见 手册 页 ， 通 第 位 于 pthread.h 条 目下 ) ， 但 只 对 其 中 的 两 个 

(detachedstatefllschedpolicy) 做 详细 的 介绍 : 


KO include <pthread.h> 
int pthread attr setdetachstate(pthread attr t *attr, int detachstate); 
int pthread attr getdetachstate(const pthread attr t *attr, int *detachstate); 


int pthread attr setschedpolicy(pthread attr t *attr, int policy); 


int pthread attr getschedpolicy(const pthread attr t *attr, int *policy); 


int pthread attr setschedparam(pthread attr t *attr, const struct sched param 
*param); 


int pthread attr getschedparam(const pthread attr t *attr, struct sched param 
*param); 


int pthread attr setinheritsched(pthread attr t *attr, int inherit); 

int pthread attr getinheritsched(const pthread attr t *attr, int *inherit); 
int pthread attr setscope(pthread attr t *attr, int scope); 

int pthread sttr getscope(const pthread attr t *attr, int *scope); 

int pthread attr setstacksize(pthread attr t *attr, int scope); 


int pthread attr getstacksize(const pthread attr t *attr, int *scope); 


aRBLAL, FY DAE AAA ESE SS [HsEyeHyxe, TJOBP A 
需要 设置 太 多 属性 就 可 以 让 程序 正常 工作 。 
O detachedstate: 这 个 属性 允许 我 们 无 需 对 线程 进行 重新 合并 。 
与 大 多 数 _set 类 函数 一 样 ， 它 以 一 个 属性 指针 和 一 个 标志 为 参数 
来 确定 需要 的 状态 。pthread_attr_setdetachstate 芳 数 可 能 用 到 的 两 
^ 标志 分别 是 PTHREAD CREATE JOINABLE 和 
PTHREAD CREATE DETACHED 。 这 个 属性 的 默认 标志 值 是 
PTHREAD_CREATE_JOINABLE， 所 以 可 以 允许 两 个 线程 重新 合 
并 。 如 果 标 志 设 置 为 PTHREAD _CREATE_DETACHED， 就 不 能 
调用 pthread_join 来 获得 另 一 个 线程 的 退出 状态 。 
口 schedpolicy: 这 个 属性 控制 线程 的 调度 方式 。 它 的 取 值 可 以 是 
SCHED_OTHER、SCHED_RP 和 SCHED_FIFO。 这 个 属性 的 默认 
值 为 SCHED_OTHER。 男 外 两 种 调度 方式 只 能 用 于 以 超级 用 户 权 
限 运 行 的 进程 ， 因 为 它们 都 具备 实时 调度 的 功能 ， 但 在 行为 上 略 
有 区 别 。SCHED_RP 使 用 循环 (round-robin) 调度 机 制 ， 而 
SCHED_FIFO 使 用 “先进 先 出 * 策 上 略 。 
O schedparam: 这 个 属性 是 和 schedpolicy 属 性 结合 使 用 的 ， 它 可 
以 对 以 SCHED_OTHER 策 略 运 行 的 线程 的 调度 进行 控制 。 我 们 将 
在 本 章 的 后 面 看 到 一 个 使 用 这 个 属性 的 例子 。 
口 inheritsched : 这 个 属性 可 取 两 个 值 : 
PTHREAD EXPLICIT SCHED 和 PTHREAD INHERIT SCHED ° 


Ar 


X 


它 的 默认 取 值 是 PTHREAD_EXPLICIT SCHED ， 表 示 调 度 由 属性 
明确 地 设置 。 如 果 把 它 设置 为 PTHREAD INHERIT SCHED， 新 
线程 将 沿用 其 创建 者 所 使 用 的 参数 。 

O scope: 这 个 属性 控制 一 个 线程 调度 的 计算 方式 。 由 于 目前 
Linux 只 支持 它 的 一 种 取 值 PTHREAD_SCOPE_SYSTEM， 所 以 在 
这 里 我 们 就 不 做 进一步 介绍 了 。 

O stacksize: 这 个 属性 控制 线程 创建 的 栈 大 小 ， 单 位 为 字 节 。 它 
属于 POSIX 规 范 中 的 “可 选 * 部 分 ， 只 有 在 定义 了 宏 
_POSIX_THREAD_ATTR_STACKSIZE 的 实现 版 本 中 才 支 持 。 
Linux 在 实现 线程 时 ， 默 认 使 用 的 栈 很 大 ， 所 以 这 个 功能 对 Linux 


来 说 显得 有 些 多 余 。 


验 设置 脱离 状态 属性 
在 脱离 线程 示例 thread5.c 中 ， 我 们 创建 一 个 线程 属性 ， 将 其 设置 


为 脱离 状态 ， 然 后 用 这 个 属性 创建 一 个 线程 。 子 线程 结束 时 ， 它 照常 
调用 pthread_exit， 但 这 次 ， 原 先 的 线程 不 再 等 待 与 它 创 建 的 子 线程 重 
新 合并 。 主 线程 通过 一 个 简单 的 thread finished 标志 来 检测 子 线程 是 否 
已 经 结束 ， 并 显示 线程 之 间 仍 然 共 享 着 变量 。 


"inciUGe <stdio.h> 

Ginclude <unistd.h> 
Sinclude <atdlib.t» 
includes <pthread.h> 


void *thread function(void *arg) ; 


char mezsage[] = “Hello World": 
int threat finished = 0; 


int main() ( 
int res; 
pthresd t a thread; 


pthread artr t thread ettr; 


res = pthread attr init (áthread attr); 
if ires t= 0) ( 
perror(*Attribute creation failed*]; 
exit|EXIT FAILURS|| 
) 
res = pthread attr setjetachstate(Athread attr, PTHREAD CREATE DETACHED), 
if (res t= OF { 
parror(*Setting detached attribute falled*!i! 
exit (EXIT_FAILURE! ; 
) 
res = pthresd_creste(ba_thresd, «thread attr, 
thread function, (vold *|messsge!; 
if {ree | 6) ( 
perror|*Thread creation failed"); 
exitiEXIT FAILURR!; 
} 
(void)pthreed attr destroy(éthread atte]; 
while(!thread finished) | 
printfi('Waiting for thread to say it's finiabed,...in*]: 
sleepill! 
} 
printf|*Other thread finished, bye! \n*); 
wxitiEXIT SUCCESS], 
) 


void *thread_functionivoid "arg) [ 
printf('thread function is running. Argument was e\n*. (char *)arg); 
sleep!i); 
printfí*Zecond thread setting finished flag, and exiting nowin*): 
thread finished = 1; 
pthread exit(NULL): 


输出 结果 是 : 
$ ./thread5 
Waiting for thread to say it's finished... 
thread function is running. Argument was Hello World 
Waiting for thread to say it's finished... 
Waiting for thread to say it's finished... 
Waiting for thread to say it's finished... 
Second thread setting finished flag, and exiting now 
Other thread finished, bye! 


如 你 所 见 ， 设 置 脱离 状态 属性 可 以 允许 第 二 个 线程 独立 地 完成 工 
作 ， 而 无 需 原 先 的 线程 等 待 它 。 

实验 解析 

这 个 程序 中 有 两 段 比 较 重要 的 代码 ， 第 一 段 代码 是 : 


pthread_attr_t thread_attr; 


res = pthread attr init(&thread attr); 
if (res l= 0) { 
perror("Attribute creation failed"); 
exit (EXIT_FAILURE) ; 


PT RR 性 并 对 其 ITERA 化 ， 第 二 段 代码 是 : 


hread_attr_setdetachstate(atnread_at FPIHKKAU CKEATE UtPVAUMNUJ ; 
re = 0 
iiie Mibi ur - tached att ute failed’); 
e IT FAI 


它 把 属性 的 值 设 置 为 脱离 状态 。 
PAHS GRD H ee eS S IE FEHB HES 


= pthread create|&a thread, &thread_attr, thread fun void 


属性 用 完 后 ， 对 其 进行 清理 回收 : 


ptnread_attr_destroy («tnreaa_attr) ; 


es 8E 

A EZB AIF BT Be 望 修 改 的 线程 属性 : 调度 。 改 变调 度 属 
性 和 设置 脱离 状态 非常 类 似 ， 可 以 用 sched_get_priority_max 和 
sched. get. priority. min 这 两 个 画 数 来 查找 可 用 的 优先 级 级 别 。 


因为 这 里 的 程序 thread6.c 与 前 面 的 例子 很 相似 所 以 我 们 只 显示 
它 与 前 面 例 子 的 不 同 之 处 。 
(1) 首先 ， 定 义 一 些 额外 的 变量 
int max_priority; 
int min_priority; 
struct sched_param scheduling_value; 


(2) 设置 好 脱离 属性 后 ， 设 置 调度 策略 : 
res = pthread_attr_setschedpolicy(&thread_ attr, SCHED OTHER); 
if (res != 0) ( 
perror('Setting scheduling policy failed"); 
exit (EXIT FAILURE!; 


(3) 接 下 来 查找 允许 的 优先 级 范围 : 


max_priority 
min_priority 


sched get priority max(SCHED OTHER) 
sched get priority min(SCHED OTHER) 


(4) 然后 设置 优先 级 : 
scheduling value.sched priority = min priority: 
res - pthread attr setschedparam(&thread attr, &scheduling. value); 
if (res != 0) ( 

perror (“Setting scheduling priority failed"); 

exit (EXIT_FAILURE) ; 


运行 这 个 程序 ， 它 的 输出 如 下 所 示 : 
$ ./thread6 
Waiting for thread to say it's finished... 


thread_function is running. Argument was Hello World 
Waiting for thread to say it's finished... 

Waiting for thread to say it's finished... 

Waiting for thread to say it's finished... 

Second thread setting finished flag, and exiting now 
Other thread finished, bye! 


实验 解析 
这 与 设置 脱离 状态 属性 很 相似 ， 区 别 只 是 我 们 设置 的 是 调度 策 
At o 


12.7 ”取消 一 个 线程 


有 时 ， 我 们 想 让 一 个 线程 可 以 要 求 男 一 个 线程 终止 ， 束 像 给 它 发 
送 一 个 信号 一 样 。 线 程 有 方法 可 以 做 到 这 一 点 ， 与 信号 处 理 一 样 ， 线 
程 可 以 在 被 要 求 终 止 时 改变 其 行为 。 

先 来 看 看 用 于 请 求 一 个 线程 终止 的 函数 : 


#include <pthread.h> 


int pthread cancel(pthread t thread); 


ECT ENAZAXBJAE X8] ERA ER. Pep AREAS, dEÁ IRL RI DAZ 
送 请 求 来 取消 它 。 但 在 接收 到 取消 请 求 的 一 端 ， 事 情 会 稍微 复杂 
点 ， 不 过 也 不 是 非常 复杂 。 线 程 可 以 用 pthread_setcancelstate 设 置 自己 
的 取消 状态 。 


#include <pthread.h> 


int pthread_setcancelstate(int state, int *oldstate); 

第 一 个 参数 的 取 值 可 以 是 PTHREAD_ CANCEL ENABLE, ， 这 个 
值 允 许 线 程 接收 取消 请 求 ;或 者 是 PTHREAD_CANCEL_DISABLE ， 
它 的 作用 是 忽略 取消 请 求 。oldstate 指 针 用 于 获取 先前 的 取消 状态 。 如 
果 你 对 它 没 有 兴趣 ， 只 需 传 递 NULL 给 它 。 如 果 取 消 请 求 被 接受 了 ， 
线程 就 可 以 进入 第 二 个 控制 层次 ， 用 pthread_setcanceltype 设 置 取 消 类 
型 o 

#include <pthread.h> 


int pthread setcanceltype(int type, int *oldtype); 

type 2 XX n" D 有 两 种 取 值 : 一 个 是 
PTHREAD_CANCEL_ASYNCHRONOUS， 它 将 使 得 在 接收 到 取消 请 
求 后 立即 采取 行动 ， 另 一 个 是 PTHREAD_CANCEL DEFERRED, È 
将 使 得 在 接收 到 取消 请 求 后 ， 一 直 等 待 直到 线程 执行 了 下 述 函 数 之 一 
后 才 采 取 和 行动。 具体 是 函数 pthread join ^ pthread cond wait ^ 
pthread cond timedwait ^ pthread testcancel ^ sem, waitEVsigwait ° 

341 Hg EE PARSE NAAT, AAA EAT AIH 
ogee ° 与 往常 一 样 ， 更 详细 的 资料 可 以 在 它们 的 手册 页 

> 五 | 。 


根据 POSIX 标 准 ， 其 他 可 能 阻塞 的 系统 调用 ， 如 read、wait 等 
也 可 以 成 为 取消 点 。 在 撰写 本 书 时 ，Linux 还 不 支持 所 有 这 些 系 统 
调用 都 能 成 为 取消 点 。 但 一 些 实验 证 明 ， 某 些 阻塞 调用 ， 如 sleep 
确实 允许 取消 动作 的 发 生 。 为 安全 起 见 ， 你 可 能 会 想 在 估计 会 被 
取消 的 代码 中 添加 一 些 pthread_testcancel 调 用 。 


oldtype 人 参数 可 以 保存 先前 的 状态 ， 如 果 不 想 知 道 先 前 的 状态 ， 可 
以 传递 NULL 给 它 。 默 认 情 况 下 ， 线 程 在 启动 时 的 取消 状态 为 
PTHREAD CANCEL ENABLE , 取消 类 型 是 PTHREAD 
CANCEL DEFERRED ° 


X 验 取 一 个 线程 


程序 thread7.c 还 是 基于 threadl.c。 这 一 次 ， 主 线程 回 它 创建 的 线程 
发 送 一 个 取消 请 求 。 


lude «pthread.h» 


res = pthread join[a thread, éthread_result); 
if (res te 0) 1 
perror('Thread join failed"): 
exit (EXIT FAILURE): 
! 
exit[EXIT SUCCESS]; 


void *thread function(void *arg] { 
int i, res; 
res = pthread sotcancelstate|PTHREAD CANCEL ENABLE, NULL): 
if (res t= 0) { 
perror(*Thread pthread setcancelstate failed’); 
oxit (EXIT_FAILURE) ; 
} 
res = pthread setcanceltype(PTHREAD CANCEL DEFERRED, NULL): 
if (res t= 0) { 
perror(*Thread pthread setcanceltype failed“): 
exit (EXIT_FAILURE) ; 
| 
printf|*'thread function is running\n*); 
for{i = 0; 1 < 10; ive) ( 
printf(*Thread is still running i#d)...\n*, 1]; 
sleepill; 
} 
pthread_exit (0); 
! 


运行 这 个 程序 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 ， 显 示 线 程 已 

被 取消 : 

$ ./thread7 

thread_function is running 

Thread is still running (0)... 

Thread is still running (1)... 

Thread is still running (2)... 

Canceling thread... 

Waiting for thread to finish... 


$ 
实验 解析 
以 通常 的 方法 创建 了 新 线程 后 ， 主 线程 休眠 一 会 儿 (好 让 新 线程 
有 时 间 开 始 执行 ) ， 然 后 发 送 一 个 取消 请 求 。 如 下 所 示 : 


sleep (3); 

printf("Cancelling thread...\n"); 

res = pthread cancel(a thread); 

if (res != 0) ( 
perror("Thread cancelation failed"); 
exit(EXIT FAILURE); 


在 新 创建 的 线程 中 ， 我 们 首先 将 取消 状态 设置 为 多 许 取 消 ， 如 下 
所 示 : 
res = pthread setcancelstate(PTHREAD CANCEL ENABLE, NULL); 
if (res := 0) ( 
perror("Thread pthread_setcancelstate failed"); 


exit (EXIT_FAILURE) ; 


} 
然后 将 取消 类 型 设置 为 延迟 取消 ， 如 下 所 示 : 
res = pthread_setcanceltype(PTHREAD_CANCEL_DEFERRED, NULL); 
if (res != 0) ( 
perror("Thread pthread setcanceltype failed"); 
exit (EXIT_FAILURE); 


了 最 后 ， 线 程 在 循环 中 等 待 被 取消 ， 如 下 所 示 : 
for(i = 0; i « 10; i++) ( 

printf("Thread is still running (%d)...\n", i); 

sleep(1); 


12.8 线程 


至 此 ， 我 们 总 是 让 程序 的 主 执行 线程 仅仅 创建 一 个 线程 。 但 我 们 
并 不 想 让 读者 认为 你 只 能 多 创建 一 个 线程 。 


X 验 多 线程 
在 本 章 最 后 的 例 季 thread8.c 中 ， 我 们 将 演示 如 何在 同一 个 程序 中 


include <stdlib.h> 
include «pthread.h» 


$define NUM THREADS 6 
void *thread function(void *arg); 


int mainí() ( 
int res; 
pthread t a thread[NUM THREADS] ; 
void *thread result; 
int lots of threads; 


for(lots.of. threads = 0; lots of threads < NUM. THREADS; lots of threads*«) ( 
res = pthread create(&([a thread[lots.of threads]], 
NULL, thread function, (void *)&lots. of threads!; 
if [res t= 0) { 
perror('Thread creation failed*]; 
exit (EXIT_FAILURE) ; 


) 
sleep(l); 


printf(*Waiting for threads to finish...\n"); 
for(lots of threads = NUM, THREADS - 1; lots of threads >= 0; 
lots of threads--) ( 


res = pthread_join(a_cthread[lots_of threads], &thread result); 
if [zes == 0) ( 
printt(*Picked up a thread\n*); 


else [ 
perror['pthread join failed"); 
) 


j 
pzintf(*All done\n"); 
exit(EXIT SUCCESS); 


void *thread functionivoid *arg) (| 
int my number = ‘(int *)arg: 
int rand.num: 


printf|'thread function is running. Argument was Wdin*, my number]; 
rand, nume]l* (int) (9.0*rand()/(RAND MAX*1.01]:; 

sleep (cand_num) ; 

printt(*Bye from MdAin*, my number); 

pthresd_exit (NULL) j 


运行 这 个 程序 时 ， 将 看 到 如 下 所 示 的 输出 结果 : 
$ ./thread8 
thread function is running. Argument was 
thread function is running. Argument was 
thread function is running. Argument was 
thread function is running. Argument was 
thread function is running. Argument was 
Bye from 1 
thread function is running. Argument was 5 
Waiting for threads to finish... 
Bye from 5 
Picked up a thread 
Bye from 
Bye from 2 
Bye from 3 
Bye from 4 
Picked up a thread 
Picked up a thread 
Picked up a thread 
a 
a 


uu 


ib» Ww fO RP © 


e 


Picked up thread 
Picked up thread 
All done 


如 你 所 见 ， 我 们 创建 了 许多 线程 并 让 它们 以 随意 的 顺序 结束 执 
行 。 这 个 程序 有 一 个 小 漏洞 ， 如 宋 将 sleep 调 用 从 局 动 线程 的 循环 中 删 
除 ， 它 束 会 变 得 很 明显 。 我 们 通过 它 提 本 读者 ， 在 编写 使 用 线程 的 程 
序 时 需要 多 么 小 心 。 你 发 现 错误 在 哪里 了 吗 ? 我 们 将 在 下 面 的 “实验 解 
析 ” 中 解释 它 。 

实验 解析 

这 一 次 ， 我 们 创建 了 一 个 线程 ID 的 数组 ， 如 下 所 示 : 


pthread_t a_thread[NUM_THREADS] ; 


然后 通过 循环 创建 多 个 线程 ， 如 下 所 示 : 


a_thread(lots_of threads 
ead functior 


ation failed" 


创建 出 的 线程 等 等 一 段 随机 的 时 间 后 退出 运行 ， 如 下 所 示 : 


I "(ant "Harg 
nt rand num 


EE (原先 ) 线程 中 ， 我 们 等 待 合 并 这 些 子 线程 ， 但 并 不 是 以 创 
建 它 们 的 顺序 来 合并 ， 如 下 所 示 : 


如 果 删 除 sleep 调 用 后 再 运行 这 个 程序 ， 束 可 能 会 看 到 一 些 奇 怪 的 
ee ee 
Bj nu: 


thread_tunction is running. Argument was 
thread function is running. Argument was 


hread function is running. Argument was 
thread function is running. Argument was 


thread, function is running. Argument was 
thread function is running. Argument was 
Waiting for threads to finish... 


Un a & Oo 


Bye from 5 
Picked up a thread 
Bye from 2 


Bye trom 0 
Bye from 2 
Bye from 4 
Bye from 4 


Picked up a thread 


Picked up à thread 


Picked up a thread 

Picked up a thread 

Picked up a thread 

All done 

URE 发 现 为 什么 会 出 现 这 样 的 问题 吗 ? 局 动 线程 时 ， 线 程 函数 的 


参数 征 一 个 局 部 变量 ， 这 个 变量 在 循环 中 被 更 新 ， 引 起 问题 的 代码 行 
是 : 


res = pthread createík&a ee mace ts of threads) NULL 
"ad. void *Jj&álot: f£ threads 


tO RE ABET NA BL AA 改变 某 些 线程 的 参数 (BU 
lots of threads) 。 当 对 共享 变量 和 多 个 执 和 Ni Rau aire 
时 ， 程 序 就 有 可 能 出 现 这 样 的 错误 行为 。 我 们 已 经 警告 过 ， 编 写 线程 
程序 时 需要 在 设计 上 特别 小 心 。 要 改正 这 个 问题 ， 
这 个 参数 的 值 ， 如 下 所 示 : 


BINGE Creace (aja Lnreadg[(io0LrB OL LHrends PRU IUDCLilo0n 
threads 


当然 还 要 修改 thread function 函 数 ， 如 下 所 示 : 
void *thread_tunction(void *arg) i 


int my number = (int)arg; 


这 些 修 改 都 在 程序 thread8a.c 中 以 阴影 部 分 显示 出 来 了 ， 如 下 所 


ZR: 


void *thread_function(void *arg) [ 
int my number = (intiarg: 
Jg 864 LIE FERE threadis PLIMEN EREET, n FRE: 


finclude <stdio.t> 

tinclude <unistd.h> 
#include «stdlib.h» 
tinclude <string.h> 
include «pthread.h» 


tdefine NUM THREADS $ 
void *thread functionivold *arg!: 
int main(] ( 


int res: 

pthread t a thread[NUM THREADS]: 

void *thread result; 

int lota of threndo: 

forilots of threads = 0; lots of threads < NUM THREADS: lots of threads««] | 


res » pthread creste(&(a thread[lots of threads]], NULL, 
thread function, (void *]lots of threads); 
if {rem te 0) [ 


princt(*Waiting for threads to finish... \n*); 
for(lota_of_threeds = NUM THREADS - 1; lota cf threads >= D; lots_cof_threade--) | 
res = pthread jcin(a thread[lota of threadg], thread reguit); 
if (rea == 0) ( 
printfi'Picked up & threadin"!; 
) eine ( 


printf(*Ail done\n*); 


exit(EXIT, SUCCESS! ; 
) 


void *thread function(void *arg) 4 
int my number = [int)arg; 
int rand, num; 


printf(*thread function is running. Argument was &din*, my number]; 
rand numsl«(int]|9.0*rand|)/([RAND MAX«1.0]); 

sieep|rand num]; 

printf(*Bye from $din', my number]; 


pthread exit (NULL); 


12.9 ”人 小结 


在 本 章 中 ， 我 们 介绍 了 如 何在 一 个 进程 中 创建 多 个 执行 线程 ， 
个 线程 共 译 着 文件 范围 的 变量 。 接 着 ， 我 们 介绍 了 线程 对 关键 代码 和 
数据 的 两 种 访问 控制 方法 一 一 使 用 信号 量 和 互 不 量 。 此 后 ， 我 们 介绍 
了 如 何 控制 线程 的 属性 ， 每 别 介绍 了 如 何 才能 将 子 线程 和 主线 程 分 离 
开 来 ， 使 主线 程 无 需 等 待 它 创建 的 子 线程 终止 运行 。 在 简单 介绍 完 一 
个 线程 如 何 请 求 另 一 个 线程 结束 运行 以 及 接收 端的 线程 如 何 处 理 这 类 
请 求 之 后 ， 我 们 展示 了 一 个 有 多 个 并 发 执行 线程 的 程序 示例 。 

我 们 没有 详细 介绍 每 个 钞 数 调用 和 与 线程 有 关 的 各 类 事物 ， 但 你 
现在 应 该 对 线程 有 了 初步 的 了 解 了 ， 可 以 笑 试 编写 和 目 己 的 线程 程序 
了 。 通 过 阅读 相关 的 手册 页 ， 你 可 以 对 线程 有 更 加 深入 的 了 解 。 


13 进程 间 通 信 : 


在 第 11 音 ,我 们 看 到 了 一 种 在 两 个 进程 间 发 送 消息 的 非常 简单 
的 方法 : 使 用 信和 号。 我 们 创建 通知 事件 ， 通 过 它 引 起 响应 ， 但 传送 的 
信息 只 限于 一 个 信号 值 。 

在 本 章 中 ， 我 们 将 介绍 管道 ， 通 过 它 进程 之 间 可 以 交换 更 有 用 的 
数据 。 在 本 章 的 最 后 ， 我 们 将 用 新 学 到 的 知识 将 CD 数据 库 应 用 程序 重 
新 实现 为 一 个 非常 简单 的 客户 /服务 器 应 用 程序 。 

我 们 将 在 本 章 中 介绍 以 下 几 方 面 的 内 容 : 
管道 的 定义 
进程 管道 
管道 调用 
父 进 程 和 子 进程 
命名 管道 : FIFO 
客户 /服务 器 架构 
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13.1 人 是 


当 从 一 个 进程 连接 数据 流 到 为 一 个 进程 时 ， 我 们 使 用 术语 管道 
p. 。 我们 通常 是 把 一 个 进程 的 输出 通过 管道 连接 到 另 一 个 进程 
N HIJ o 

AZ 3X LinuxBy Hl P! SA 8E ESI K shell 4 Xe Bere — EA EAR AA 
as I, AXMED i — 1 Xt REUS D BL BE PR A PY A80 
T ubi d 
ZN: 

cmd1 | cmd2 

shell 负责 安排 两 个 命令 的 标准 输入 和 标准 输出 。 

O cmd1 的 标准 输入 来 目 终 闪 键盘。 

D cmdl 的 标准 输出 传递 给 cmd2， 作 为 它 的 标准 输入 。 

O cmd2 的 标准 输出 连接 到 终端 屏幕 。 

shell 所 做 的 工作 实际 上 是 对 标准 输入 和 标准 输出 流 进 行 了 重 狐 连 
接 ， 使 数据 流 从 键盘 输入 通过 两 个 命令 最 终 输 出 到 屏幕 上 ， 见 图 13- 


1° 
ERER, BAT FRE EU AU EE PRE OR, EH E 
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/ 标准 输入 | 


| 
CMD1 7 A 管道 


i 7 LA CMD2 PA 一 


—ÀÁÁÀ j 


13.2 HIERE 


RH] BE fc fe] EAE PTT e FP Z IRI Pe HR A 73 TE ze E H popen 7 
pclosekžt T ° CRE S BrZR: 


#include <stdio.h> 


FILE *popen (const char *command, const char *open_mode) ; 

int pclose (FILE *stream_to_close) : 

1. popen iK% 

popen 函 数 允 许 一 个 程序 将 另 一 个 程序 作为 新 进程 来 启动 ， 并 可 以 
传递 数据 给 它 或 者 通过 它 接收 数据 。command 字 符 串 是 要 运行 的 程序 
名 和 相应 的 参数 。open_mode 必 须 是 “Tr” 或 者 “w”。 

如 果 open_mode 是 “r”， 被 调用 程序 的 输出 就 可 以 被 调用 程序 使 
用 ， 调 用 程序 利用 popen 函 数 返 回 的 FILE* 文 件 流 指 针 ， 束 可 以 通过 和 党 
用 的 stdio 库 函数 〈《 如 fread) 来 读 取 被 调用 程序 的 输出 。 如 果 
open_mode 是 “w”， 调 用 程序 就 可 以 用 fwrite 调 用 向 被 调用 程序 发 送 数 
据 ， 而 被 调用 程序 可 以 在 自己 的 标准 输入 上 读 取 这 些 数据 。 被 调用 的 
程序 通常 不 会 意识 到 自己 正在 从 男 一 个 进程 读 取 数据 ， 它 只 是 在 标准 
输入 流 上 读 取 数据 ， 然 后 做 出 相应 的 操作 。 

^" popen Val H ALU 201 8 Er" 8k"w", TE popen K ACA hp SE EL n 
不 文 持 任何 其 他 选项 。 这 意味 着 我 们 不 能 调用 另 一 个 程序 并 同时 对 它 
进行 读 写 操作 。popen 函 数 在 失败 时 返回 一 个 空 指针 。 如 果 想 通过 管道 
实现 双 辐 通信， 最 普通 的 解决 方法 是 使 用 两 个 管道 ， 每 个 管道 负责 一 
个 方 同 的 数据 流 。 

2. pclose 函 数 

用 popen 启 动 的 进程 结束 时 ， 我 们 可 以 用 pclose 函 数 天 闭 与 之 天 联 
的 文件 流 。pclose 调 用 只 在 popen 局 动 的 进程 结束 后 才 返 回 。 如 有 果 调 用 
pclose 时 它 仍 在 运行 ，pclose 调 用 将 等 待 该 进程 的 结束 。 

pclose 调 用 的 返回 值 通常 是 它 所 关闭 的 文件 流 所 在 进程 的 退出 
码 。 如 果 调 用 进程 在 调用 pclose 之 前 执行 了 一 个 wait 语 句 ， 被 调用 进程 
的 退出 状态 就 会 丢失 ， 因 为 被 调用 进程 已 结束 。 此 时 ，pclose 将 返回 -1 
并 设置 errno 为 ECHILD ° 


实 验 读 取 外 部 程序 的 输出 
现在 来 看 一 个 简单 的 popen 和 pclose 示 例 程序 popenl.c。 我 们 将 在 
程序 中 用 popen 访 问 uname 命 令 给 出 的 信息 。 命 令 uname-a 的 作用 是 打 


印 系 统 信息 ， 包 括 计 算 机 型 号 、 操 作 系 统 名 称 、 版 本 和 发 行 号 ， 以 及 
计算 机 的 网 络 名 。 

完成 程序 的 初始 化 工作 后 ， 打 开 一 个 连接 到 uname 命 令 的 管道 ， 
把 管道 设置 为 可 读 方 式 并 让 read_fp 指 向 该 命令 的 输出 。 最 后 ， 关 闭 
read_fp 指 向 的 管道 。 


运行 这 个 程序 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 (这 是 在 本 书 其 
中 一 位 作者 的 机 器 上 的 输出 结果 ) : 


popeni 


实验 解析 

这 个 程序 用 popen 调 用 启动 市 有 -a 选项 的 name 命 令 。 然 后 用 返回 
的 文件 流 读 取 最 多 BUFSIZ 个 字符 (这 个 常量 是 在 stdio.h 中 用 #define 语 
句 定义 的 ) 的 数据 ， 并 将 它们 打印 出 来 显示 在 屏幕 上 。 因 为 我 们 是 在 
程序 内 部 捕获 uname 命 令 的 输出 ， 所 以 可 以 处 理 它 。 


13.3 将 输出 送 往 popen 


看 过 捕获 外 部 程序 输出 的 例子 后 ， 我 们 再 来 看 一 个 将 输出 发 送 到 
外 部 程序 的 示例 程序 popen2.c， 它 将 数据 通过 管道 送 往 男 一 个 程序 。 
我 们 在 这 里 使 用 的 是 od (八进制 输出 ) 命令 。 


X 验 将 输出 送 往外 部 程序 

我 们 可 以 看 到 ， 下 面 这 个 程序 popen2.c 非 常 类 似 于 前 面 的 示例 程 
唯一 的 不 同 是 这 个 程序 十 将 数据 写 入 管道 ， 而 不 古 从 管道 中 读 
Xo 


exit (EXIT_FAILURE) ; 


实验 解析 

程序 使 用 禹 有 参数 “w” 的 popen 局 动 od-c 命 令 ， 这 样 就 可 以 癌 该 命 
令 发 送 数据 了 。 然 后 它 给 od-c 命 令 发 送 一 个 字符 串 ， 该 命令 接收 并 处 
理 它 ， 最 后 把 处 理 结 果 打 印 到 目 己 的 标准 输出 上 。 

在 命令 行 上 ， 我 们 可 以 用 下 面 的 命令 得 到 同样 的 输出 结果 : 


$ echo "Once upon a time, there was..." | od -c 


13.3.1 j | 


我 们 目前 所 使 用 的 机 制 都 只 是 将 所 有 数据 通过 一 次 fread 或 fwrite 调 
用 来 发 送 或 接收 。 有 时， 我 们 可 能 希望 能 以 块 方式 发 送 数 据 ， 或 者 我 
们 根本 就 不 知道 输出 数据 的 长 度 。 为 了 避免 定义 一 个 非常 大 的 缓冲 
区 ， 我 们 可 以 用 多 个 fread 或 fwrite 调 用 来 将 数据 分 为 几 部 分 处 理 。 

下 面 这 个 程序 popen3.c 通 过 管道 读 取 所 有 数据 。 


X 验 通过 管道 读 取 大 量 数据 
在 这 个 程序 中 ， 我 们 从 被 调用 的 进程 ps ax 中 读 取 数据 。 该 进程 输 
出 的 数据 有 多 少 事先 无 法 知道 ， 所 以 我 们 必须 对 管道 进行 多 次 读 取 。 


istd 


tinclude stdio. i 


set(buffer, '\0*, s buffe 
1 fp popen(*ps ax* ) ; 
read fp t= NULL) { 
cha read = freadibuff sizeofic BUF fp 
whi (chara, read 0) 
buffer[chars read =- 1) = 0 
f ("Reading td n ts E b e 
_read adibuffer ch JFSI 1 
d f 
suc 


exit(EXIT FAILURE] 


为 简 尘 起见， 我 们 对 程序 的 输出 做 了 一 些 修 改 ， 如 下 所 示 : 


$ ./popen3 
Reading 1024:- 
PID TTY STAT TIME COMMAND 


1 ? Ss 0:03 init [5] 

2 ? SW 0:00 [kflushd] 

3 ? SW 0:00 [kpiod] 

4 ? SW 0:00 [kswapd] 

5 ? SW« 0:00 [mdrecoveryd] 
240 tty2 S 0:02 emacs draftl.txt 


Reading 1024:- 
368 ttyl S 0:00 ./popen3 
369 ttyl R 0:00 ps -ax 


实验 解析 

这 个 程序 调用 popen 函 数 时 使 用 了 ”参数 ， 这 与 popenl.c 程 序 的 做 
法 一 样 。 这 次 ， 它 连续 从 文件 流 中 读 取 数据 ， 直 到 没有 数据 可 读 为 
止 。 注 意 ， 虽 然 ps 命 令 的 执行 要 花费 一 些 时 间 ， 但 Linux 会 安排 好 进程 
间 的 调度 ， 让 两 个 程序 在 可 以 运行 时 继续 运行 。 如 果 读 进程 popen3 没 
有 数据 可 读 ， 它 将 被 挂 起 直到 有 数据 到 达 。 如 果 写 进程 ps 产生 的 输出 
"M 

在 本 例 中 ， 你 可 能 不 会 看 到 Reading: -信息 的 第 二 次 出 现 。 如 果 
BUFSIZ 的 值 超过 了 ps 命令 输出 的 长 度 ， 这 种 情况 就 会 发 生 。 一 些 (最 
新 的 ) Linux 系 统 将 BUFSIZ 设 置 为 8 192 或 更 大 的 数字 。 为 了 测试 程序 
在 读 取 多 个 输出 数据 块 时 能 够 正常 工作 ， 你 可 以 党 试 每 次 读 取 少 于 
BUFSIZ 个 字符 (比如 BUFSIZE/10 个 字符 ) 


13.3.2 如何 实现 popen 

请 求 popen 调 用 运行 一 个 程序 时 ， 它 首先 启动 shell， 即 系统 中 的 sh 
命令 ， 然 后 将 command 字 人 符 串 作 为 一 个 参数 传递 给 它 。 这 有 两 个 效 
iR, 一 个 好 一 个 不 太 好 有 * 


在 Linux (以 及 所 有 的 类 UNIX 系 统 ) 中 ， 所 有 的 参数 扩展 都 是 由 
shell 来 完成 的 。 所 以 ， 在 启动 程序 之 前 先 启动 shell 来 分 析 命 令 字 符 
串 ， 就 可 以 使 各 种 shell 扩 展 (如 *.c 所 指 的 是 哪些 文件 ) 在 程序 启动 之 
前 束 全 部 完成 。 这 个 功能 非常 有 用 ， 它 人 允许 我 们 通过 popen 局 动 非常 复 
洒 的 shell 命 令 。 而 其 他 一 些 创建 进程 的 函数 (如 execl) 调用 起 来 就 复 
杂 得 多 ， 因 为 调用 进程 必须 自己 去 完成 shell 扩 展 。 

使 用 shel 的 一 个 不 太 好 的 影响 是 ， 针 对 每 个 popen 调 用 ， 不 仅 要 局 
动 一 个 被 请 求 的 程序 ， 还 要 局 动 一 个 shell， 即 每 个 popen 调 用 将 多 启动 
两 个 进程 。 从 和 省 系统 资源 的 角度 来 看 ，popen 函 数 的 调用 成 本 略 高 ， 
而 且 对 目标 命令 的 调用 比 正常 方式 要 慢 一 些 。 

我 们 用 程序 popen4.c 来 演示 popen 了 范 数 的 行为 。 这 个 程序 对 所 有 
popen 示 例 程 序 的 源 文件 的 总 行 数 进行 统计 ， 方 法 是 用 cat 命 令 显 示 文 
件 的 内 容 并 将 输出 通过 管道 传递 给 命令 wc-1， 由 后 者 统计 总 行 数 。 如 
果 是 在 命令 行 上 完成 这 一 任务 ， 我 们 可 以 使 用 如 下 命令 : 


$ cat popen* .c | wc -1 


SX E, 输入 命令 wc -1 popen*.c 更 简单 而 且 更 有 效率 ， 但 我 
们 是 为 了 通过 这 个 例子 来 演示 popen 函 数 的 工作 原理 。 


sx 验 popen 启 动 Shell 
这 个 程序 使 用 上 面 给 出 的 命令 ， 但 是 通过 popen 来 读 取 命 令 输出 的 


£H 


运行 这 个 程序 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结 采 : 


S ./popen4 
Reading: - 
94 


实验 解析 

这 个 程序 显示 ，shell 在 启动 后 将 popen*.c 扩 展 为 一 个 文件 列表 ， 列 
表 中 的 文件 名 都 以 popen 开 头 ， 以 .c 结 尾 ，shell 还 处 理 了 管道 符 (|) 并 
将 cat 命 令 的 输出 传递 给 wc 命令 。 我 们 在 一 个 popen 调 用 中 启动 了 
shell、cat 程 序 和 wc 程序 ， 并 进行 了 一 次 输出 重 定 同 。 而 调用 这 些 命令 
的 程序 只 看 到 最 终 的 输出 结 


13.4_pipe 调 用 


在 看 过 高 级 的 popen 函 数 之 后 ， 我 们 再 来 看 看 底层 的 pipe 函 数 。 通 
过 这 个 函数 在 两 个 程序 之 间 传 递 数据 不 需要 局 动 一 个 shell 来 解释 请 求 
的 命令 。 它 同时 还 提供 了 对 读 写 数据 的 更 多 控制 。 

pipe 图 数 的 原型 如 下 所 未 : 


#include <unistd.h> 


int pipe(int file descriptor[2]); 

pipe NALA 24 — A BS BS TERI SC TR le FF 28 CY AUR. 
的 指针 。 该 函数 在 数组 中 填 上 两 个 靳 的 文件 描述 符 后 返回 0， 如 果 失 败 
则 返回 -1 并 设置 errno 来 表明 失败 的 原因 。 在 Linux 手 册页 (手册 的 第 二 
部 分 ) 中 定义 了 下 面 一 些 错误 。 

O EMFILE: 进程 使 用 的 文件 描述 符 过 多 。 

口 ENFILE: 系统 的 文件 表 已 满 。 

O EFAULT: 文件 描述 从 无 效 。 

两 个 返回 的 文件 描述 符 以 一 种 特殊 的 方式 连接 起 来 。 写 到 
file_descriptor[1] 的 所 有 数据 都 可 以 从 fe_descriptor[0] 读 回来 。 数 据 基 
于 先进 先 出 的 原则 (通常 简写 为 FIFO) 进行 处 理 ， 这 意味 着 如 果 你 把 
字 有 1，2，3 写 到 fle_descriptor[1]， 从 file_descriptor[0] 读 取 到 的 数据 也 
lier 2，3。 这 与 栈 的 处 理 方式 不 同 ， 栈 采用 后 进 先 出 的 原则 ， 通 党 
简写 为 LIFO 。 


告别 要 注意 ， 这 里 使 用 的 是 文件 摘 述 符 而 不 是 文件 流 ， 所 以 
我 们 必须 用 底层 的 read 和 write 调用 来 访问 数据 ， 而 不 是 用 文件 流 
库 函 数 fread 和 fwrite ° 
下 面 的 程序 pipel.c 用 pipe 画 数 来 创建 一 个 管道 。 


验 pipeHAt 
注意 fie_pipes 数 组 的 用 法 ， 它 的 地 址 被 当 作 参数 传递 给 pipe 画 


将 


运行 这 个 程序 时 ， 输 出 结果 如 下 所 示 : 
S ./pipel 
Wrote 3 bytes 
Read 3 bytes: 123 


实验 解析 

这 个 程序 用 数组 旬 e_pipes[] 中 的 两 个 文件 描述 符 创 建 一 个 管道 。 
然后 它 用 文件 摘 述 符 fle_pipes[1] 癌 管道 中 写 数 据 ， 再 从 fle_pipes[0] 读 
回 数 据 。 注 意 ， 管 道 有 一 些 内 置 的 缓存 区 ， 它 在 write 和 read 调 用 之 间 
保存 数据 。 

如 有 果 你 尝试 用 fe_descriptor[0] 写 数据 或 用 他 e_descriptor[1] 读 数 
据 ， 其 后 果 并 未 在 文档 中 明确 定义 ， 所 以 其 行为 可 能 会 非常 奇怪 ， 并 
且 随 着 系统 的 不 同 ， 其 行为 可 能 会 发 生变 化 。 在 我 的 系统 上 ， 这 样 的 
调用 将 失败 并 返回 -1， 这 至 少 能 够 说 明 这 种 错误 比较 容易 发 现 。 

乍 看 起 来 ， 这 个 使 用 管道 的 例子 并 无 特别 之 处 ， 它 做 的 工作 也 可 
以 用 一 个 简单 的 文件 完成 。 管 道 的 真正 优势 体现 在 ， 当 你 想 在 两 个 进 
程 之 间 传 弟 数 据 的 上 时候。 我 们 在 第 12 意 讲 过 ， 当 程序 用 fork 调 用 创建 
源 进 程 时 ， 原 先 打开 的 文件 摘 述 符 仍 将 保持 打开 状态 。 如 果 在 原先 的 
进程 中 创建 一 个 管道 ， 然 后 再 调用 fork 创 建新 进程 ， 我 们 即 可 通过 管 
道 在 两 个 进程 之 间 传 递 数据 。 


Sc 验 跨越 fork 调 用 的 管道 


(1) 下 面 这 个 程序 pipe2.c 的 开始 部 分 〈 在 调用 fork 之 前 的 部 分 ) 
和 第 一 个 例子 非常 相似 。 


$include <unistd.h> 
Sinclude <stdlib.h> 
Sinclude <stéic.h> 
$include <string.h> 
int maiíni 
i 
int data processed; 
int file pipes[2]; 
const char some data[] = °123"; 
char buffer{Sursiz + 1]; 
pid t fork result; 


menset[buffer, ‘\0", sizeof[buffer]) 
if (pipeifile pípes) =» 0) ( 


fork. result = forkíli 
if (fork result == -1) { 


fprintf(stderr, "Fork failure") 
exit(EXIT FAILURE); 
} 


(2) 在 确认 fork 调 用 成 功 后 ， 如 果 fork_result 等 于 去， 就 说 明 我 
们 是 在 子 进程 中 ， 如 下 所 示 : 


if (fork.resuit == 0) { 
data processed = read(file pipes[0], buffer, BUFSIZ); 
printf(*Read td bytes: te\n*, data processed, buffer): 
exit(EXIT SUCCESS! » 


(3) 否则 ， 我 们 肯定 是 在 父 进程 中 ， 如 下 所 示 : 


else (| 
data processed = write[file pipesí1], some data, 
strlen{some_data) |; 
printfí(*Wrote Wd bytes\n’, data processed); 


S ./pipe2 
Wrote 3 bytes 
Read 3 bytes: 123 


你 可 能 会 在 实际 运行 这 个 程序 的 时 候 发 现 ， 命 令 提示 符 在 输出 结 
n 为 了 便于 阅读 ， 我 们 在 这 里 对 输出 结 采 进行 
了 调整 。 


实验 解析 

这 个 程序 首 移 用 pipe 调 用 创建 一 个 管道 ， 接 看 用 fork 调 用 创建 一 个 
新 进程 。 如 采 fork 调 用 成 功 ， 父 进程 束 写 数据 到 管道 中 ， 而 子 进程 从 
管道 中 读 取 数据 。 父 了 进程 都 在 只 调用 了 一 次 write 或 read 之 后 束 退 
出 。 如 有 果 父 进程 在 子 进程 之 前 退出 ， 你 束 会 在 两 部 分 输出 内 容 之 间 看 
到 shell 提 示 符 。 

虽然 从 表面 上 看 ， 这 个 程序 和 第 一 个 使 用 管道 的 例子 很 相似 ， 但 
实际 上 在 这 个 例子 中 我 们 往 前 路 出 了 一 大 步 ， 我 们 可 以 在 不 同 的 进程 
之 间 进 行 读 写 操作 了 ， 如 图 13-2 所 示 。 


file pipes[1] file pfpesf0] | 


f S. / tc TIN | 
! 2»: 1 | f -~ se \ | 
(sur ) ( 子 进 程 】 | 
NC A ES Z | 


图 13-2 


135 ” 父 进 程 和 子 进 程 


在 接 下 来 的 对 pipe 调 用 的 研究 中 ， 我 们 将 学 习 如 何在 子 进程 中 运 
行 一 个 与 其 父 进程 完全 不 同 的 另外 一 个 程序 ， 而 不 是 仅仅 运行 一 个 相 
同 程序 。 我 们 用 exec 调 用 来 完成 这 一 工作 。 这 里 的 一 个 难点 是 ， 通 过 
exec 调 用 的 进程 需要 知道 应 该 访问 哪个 文件 描述 符 。 在 前 面 的 例子 
中 ， 因 为 于 进程 本 身 有 fie_pipes 数 据 的 一 份 副本 ， 所 以 这 并 不 成 为 问 
题 。 但 经 过 exec 调 用 后 ， 情 况 束 不 一 样 了 ， 因 为 原 移 的 进程 已 经 被 新 
的 子 进 程 蔡 换 了 “。 为 解决 这 个 问题 ， 我 们 可 以 将 文件 描述 符 〈 它 实际 
上 只 十 一 个 数字 ) 作为 一 个 参数 传递 给 用 exec 局 动 的 程序 。 

为 了 演示 它 征 如 何 工作 的 ， 我 们 需要 使 用 两 个 程序 。 第 一 个 程序 
它 人 负责 创 建 管道 和 局 动 子 进程 ， 而 后 者 是 数据 消费 


X 验 管道 和 exec 函 数 
(1) 下 面 这 个 程序 pipe3.c 是 从 pipe2.c 修 改 而 来 。 我 们 在 改动 的 地 
方 加 上 了 阴影 ， 如 下 所 示 : 


include <unistd.h> 
include <stdlib.h> 
Sinclude <stdio.h> 
include <string.h> 


int maint) 


WW 


int data, processed; 

int file pipes[2]; 

const char some data[] = *123°; 
char buffer[BUPSIZ + 1); 

pid t fork result; 


memset(buffer, '\0', sizeof(buffer!]); 


it (pipeifile pipes) == 0] | 
fork resuit = fork(): 
if (fork result == (pi& t)-1) [ 
fprintfístderr, "Fork failure"); 
exit(EXIT FAILURE]: 


if [fork result ** 0) | 
sprintf[(buffer, *id*, file pípes[0]); 
(void)execl(*pipei4*, "piped*, buffer, ichar *]0]; 
exit (EXIT_FAILURE); 
} 
else { 
data processed = write(file pipes[ll, some data 
strleniscome daral); 
printf("$d - wrote td bytes\n", getpid(], data processed); 
) 


exit|EXIT SUCCESS) : 


(2) 数据 消费 者 程序 pipe4.c 负 责 读 取 数据 ， 它 的 代码 要 简单 得 


如 下 所 示 : 


finclude <unistd.h> 
#include <stdlib, b> 
include <stdio.h> 
finclude <string, b> 


int main(int argc, char *argv!}) 
t 
int data processed; 
char buffer[BUFSIZ + 1); 
int file descriptor; 


memset (buffer, 'i0', mizeofibufter]]; 
sscanf(argv[(1], *Sd*, &file descriptor]; 
data processed = read(file descriptor, buffer, BUFSIZ); 


princt(*td - read td bytes: Wsin*, getpid(), data proceased, buffer]; 
exit(EXIT SUCCESS); 


要 记 住 ，pipe3 在 程序 中 调用 pipe4， 运 行 pipe3 时 ， 


下 所 示 的 输出 结果 : 


我 们 将 看 到 如 


$ ./pipe3 
22460 - wrote 3 bytes 
22461 - read 3 bytes: 123 


实验 解析 
pipe3 程 序 的 开始 部 分 和 前 面 的 例子 一 样 ， 用 pipe 调 用 创建 一 个 管 
道 ， 然 后 用 fork 调 用 创建 一 个 新 进程 。 接 下 来 ， 它 用 sprintf 把 读 取 管道 


我 们 通过 execl 调 用 来 启动 pipe4 程 序 ，execl 的 参数 如 下 所 示 。 

O 要 启动 的 程序 。 

口 argv[0]: 程序 名 。 

O argv[1]: 包含 我 们 想 让 被 调用 程序 去 读 取 的 文件 描述 符 。 

Oo (char*) 0: 这 个 参数 的 作用 是 终止 被 调用 程序 的 参数 列 


表 。 
pipe4 程 序 从 参数 字符 串 中 提取 出 文件 描述 符 数 字 ， 然 后 读 取 该 文 
件 描述 符 来 获取 数据 。 


13.5.1 ig KAAS 


在 继续 学 习 之 前 ， 我 们 再 来 仔细 研究 一 下 打开 的 文件 描述 符 。 至 
此 ， 我 们 一 直 采 取 的 是 让 读 进 程 读 取 一 些 数据 然后 直接 退出 的 方式 ， 
d MU 
Hs 

但 大 多 数 从 标准 输入 读 取 数 据 的 程序 采用 的 却 是 与 我 们 到 目前 为 
止 见 到 的 例子 非常 不 同 的 男 外 一 种 做 法 。 通 党 它们 并 不 知道 有 多 少数 
据 需 要 读 取 ， 所 以 往往 采用 循环 的 方法 ， 读 取 数 据 一 一 处 理 数据 
读 取 更 多 的 数据 ， 直 到 没有 数据 可 读 为 止 。 

当 没 有 数据 可 读 时 ，read 调 用 通常 会 阻塞 ， 即 它 将 暂 信 进程 来 等 
待 直到 有 数据 到 达 为 止 。 如 有 条 管道 的 另 一 端 已 被 关 财 ， 也 融 是 说 ， 没 
有 进程 打开 这 个 管道 并 回 它 写 数 据 了 ， 这 时 read 调 用 天 会 阻塞 。 但 这 
样 的 阻塞 不 是 很 有 用 ， 因 此 对 一 个 已 关闭 写 数据 的 管道 做 read 调 用 将 
返回 0 而 不 是 阻塞 。 这 束 使 读 进程 能 够 像 检测 文件 结束 一 样 ， 对 管道 进 
行 检测 并 作出 相应 的 动作 。 注 意 ， 这 与 读 取 一 个 无 效 的 文件 摘 述 符 不 
同 ，read 把 无 效 的 文件 描述 符 看 作 一 个 错误 并 返回 -1 。 


如 果 跨 越 fork 调 用 使 用 管道 ， 就 会 有 两 个 不 同 的 文件 描述 符 可 以 
用 于 回 管 道 写 数据 ， 一 个 在 父 进程 中 ， 一 个 在 子 进 程 中 。 只 有 把 父子 
进程 中 的 针对 管道 的 写 文 件 描述 符 都 关闭 ， 管 道 才 会 被 认为 是 关闭 
了 ， 对 管道 的 read 调 用 才 会 失败 。 我 们 还 将 深入 讨论 这 一 问题 ， 在 学 
习 到 O_NONBLOCK 标 志和 FIFO 时 ， 我 们 将 看 到 一 个 这 样 的 例子 。 


13.5.2 


现在 ， 我 们 已 知道 了 如 何 使 得 对 一 个 空 管道 的 读 操作 失败 ， 下 面 
我 们 来 看 一 种 用 管道 连接 两 个 进程 的 更 简洁 的 方法 。 我 们 把 其 中 一 个 
管道 文件 描述 符 设 置 为 一 个 已 知 值 ， 一 般 是 标准 输入 0 或 标准 输出 1。 
eda 中 做 这 个 设置 稍微 有 点 复杂 ， 但 它 使 得 子 程序 的 编写 变 得 非 
7A fel HE o 

这 样 做 的 最 大 好 处 是 我 们 可 以 调用 标准 程序 ， 即 那些 不 需要 以 文 
件 描述 符 为 参数 的 程序 。 为 了 完成 这 个 工作 ， 我 们 需要 使 用 在 第 3 章 中 
ae o dup Wa PAL AR AKA, ER Aeon T 

ZN: 


#include <unistd.h> 


int dup(int file_descriptor); 
int dup2(int file descriptor one, int file descriptor two); 


dup 调 用 的 目的 是 打开 一 个 者 的 文件 描述 符 ， 这 与 open 调 用 有 点 类 
似 。 不 同 之 处 是 ，dup 调 用 创建 的 新 文 件 描述 符 与 作为 它 的 参数 的 那个 
已 有 文件 描述 符 指向 同一 个 文件 (或 管道 )。 对 于 dup 芳 数 来 说 ， 新 的 
文件 搬 述 符 总 是 取 最 小 的 可 用 值 。 而 对 于 dup2 范 数 来 说 ， 它 所 创建 的 
新 文件 描述 符 或 者 与 参数 fie_descriptor two 相同 ， 或 者 是 第 一 个 大 于 
该 参数 的 可 用 值 。 


我 们 可 以 使 用 更 通用 的 fent1 调 用 (command 参 数 设置 为 
F DUPFD) 来 达到 与 调用 dup 和 dup2 相 同 的 效果 。 虽 然 如 此 ， 但 
dup 调 用 更 易于 使 用 ， 因 为 它 是 专门 用 于 复制 文件 描述 符 的 。 而 且 
它 的 使 用 非常 普遍 ， 你 可 以 发 现 ， 在 已 有 的 程序 中 ， 它 的 使 用 比 
fcnt1 和 F_DUPFD 更 频繁 。 


那么 ，dup 十 如 何 帮 助 我 们 在 进程 之 间 传 递 数据 的 呢 ? VATES LE 
于 ， 标 准 输入 的 文件 描述 符 总 是 0， 而 dup 返 回 的 新 的 文件 描述 符 又 总 
征 使 用 最 小 可 用 的 数字 。 因 此 ， 如 采 我 们 首先 关闭 文件 描述 符 0 然 后 调 
用 dup， 那 么 痢 的 文件 摘 述 符 束 将 是 数字 0。 因 为 新 的 文件 描述 符 是 复 


HARAT, Pr DA ERT ARS BN FE a 1 3964] EXE 
给 dup 函 数 的 文件 描述 符 所 对 应 的 文件 或 管道 。 我 们 创建 了 两 个 文件 摘 
述 符 ， 它 们 指 回 同一 个 文件 或 管道 ， 而 且 其 中 之 一 是 标准 输入 。 

用 close 和 dup 画 数 对 文件 描述 符 进行 处 理 

理解 当 我 们 关闭 文件 描述 符 0， 然 后 调用 dup 究 竟 发 生 了 什么 的 最 
人 简单 的 方法 就 是 ， 查 看 开头 的 4 个 文件 描述 符 的 状态 在 这 一 过 程 中 的 改 
变 情况 ， 如 表 13-1 所 示 。 


Meee 万 % 值 RMN RLS dupiA ALS 
0 "Ww A x ia Pi sen 
2 i nu! 5 
we Hi 
nxn "i 


X 验 管道 和 dup 函 数 

再 回 到 前 面 的 例子 ， 但 这 次 ， 我 们 将 把 子 程序 的 stdin 文 件 描述 符 
玲 换 为 我 们 创建 的 管道 的 读 取 端 。 我 们 还 将 对 文件 摘 述 符 做 一 些 清 
理 ， 使 得 子 程序 可 以 正确 检测 到 管道 中 数据 的 结束 。 与 往常 一 样 ， 为 
了 简 洗 起见， 我 们 省 略 了 一 些 错误 检查 。 

用 如 下 的 代码 将 pipe3.c 修 改 为 pipe5.c: 


close(0); 

dup (file_pipes[0}) 
close(file pipes[0]]: 
close(file pipes[1]); 


cata _processe 


个 程序 的 输出 结果 如 下 所 示 : 


S ./pipe5 

22495 - wrote 3 bytes 
0000000 1 2 3 
0000003 


实验 解析 

SER mie 个 程序 创建 一 个 管道 ， 然后 通过 fork 创 建 一 个 子 
进程 。 此 时 ， PAPE TDL LO FET 一 个 用 于 读 
数据 ， 一 个 用 于 写 数据 ， 所 以 总 共有 4 个 打开 的 文件 描述 符 。 

我 们 首先 来 看 子 进程 。 子 进程 先 用 close (0) 关闭 它 的 标准 输 
De le tae file pipes[0]) 把 与 管道 的 读 取 端 关联 的 文件 描述 
符 复制 为 文件 描述 符 0， 即 标准 输入 。 接 下 来 子 进程 关闭 原先 的 用 来 


从 管道 读 取 数据 的 文件 描述 符 fie_pipes[0]。 因 为 子 进程 不 会 向 管道 写 
数据 ， 所 以 它 把 与 管道 关联 的 写 操作 文件 撞 述 符 fle_pipes[1] 也 关闭 
了 。 现 在 ， 它 只 有 一 个 与 管道 关联 的 文件 描述 符 ， 即 文件 描述 符 0， 它 
的 标准 输入 。 

接 下 来 ， 子 进程 陇 可 以 用 exec 来 局 动 任何 从 标准 输入 读 取 数 据 的 
程序 了 。 在 本 例 中 ， 我 们 使 用 的 是 od 命 令 。od 命 令 将 等 待 数据 的 到 
来 ， 承 好 像 它 在 等 竺 来 目 用 户 终 端的 输入 一 样 。 事 实 上 ， 如 果 没 有 明 
确 使 用 检测 这 两 者 之 间 不 同 的 特殊 代码 ， 它 并 不 知道 输入 是 来 自 一 个 
管道 ， 而 不 是 来 自 一 个 终端 。 

父 进程 首 移 关闭 管道 的 读 取 端 fle_pipes[0]， 因 为 它 不 会 从 管道 读 
取 数 据 。 接 着 它 同 管道 写 入 数据 。 当 所 有 数据 都 写 完 后 ， 父 进程 关闭 
管道 的 写 入 端 并 退出 。 因 为 现在 已 没有 打开 的 文件 摘 述 符 可 以 同 管道 
写 数据 了 ，od 程 序 读 取 写 到 管道 中 的 3 个 字 节 数据 后 ， 后 续 的 读 操 作 将 
返回 0 字 节 ， 表 示 已 到 达 文 件 尾 。 当 读 操 作 返 回 0 时 ，od 程 序 就 退出 运 
和 然后 按 下 Ctrl+D 组 合 键 发 送 文件 
"E YN ith n 

图 13-3 显 示 调 用 pipe 之 后 的 情况 。 
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图 13 
图 13-4 显 示 调 用 fork 之 后 的 情况 。 
file pipes[0] file pfpesf0] = 
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图 13-5 显 示 程 序 做 好 数据 传输 准备 之 后 的 情况 。 


13.6 fir id: FIFO 


至 此 ， 我 们 还 只 能 在 相关 的 程序 之 间 传 递 数据 ， 即 这 些 程序 是 由 
一 个 共同 的 祖先 进程 启动 的 。 但 如 有 果 我 们 想 在 不 相关 的 进程 之 间 交 换 
数据 ， 这 还 不 是 很 方便 。 

我 们 可 以 用 FIFO 文 件 来 完成 这 项 工作 ， 它 通常 也 被 称 为 命名 管道 

(named pipe) 。 命 名 管道 是 一 种 特殊 类 型 的 文件 AIS f Linux FEY 

所 有 事物 都 是 文件 ) ， 它 在 文件 系统 中 以 文件 名 的 形式 存在 ， 但 它 的 
行为 却 和 我 们 已 经 见 过 的 没有 名 字 的 管道 类 似 。 

我 们 可 以 在 命令 行 上 创建 命名 管道 ， 也 可 以 在 程序 中 创建 它 。 过 
去 ,命令 行 上 用 来 创建 命名 管道 的 程序 是 mknod， 如 下 所 示 : 

$ mknod filename p 

但 mknod 命 令 并 未 出 现在 X/Open 规范 的 命令 列表 中 ， 所 以 可 能 3 
不 是 所 有 的 类 UNIX 系 统 都 可 以 这 样 做 。 我 们 推荐 使 用 的 命令 行 命令 
XE: 


$ mkfifo filename 


有 些 老 版 本 的 UNIX 系 统 只 有 mknod 命 令 。X/Open 规 范 的 第 4 
期 第 2 版 中 有 mknod 函 数 调 用 ， 但 没有 对 应 的 命令 行程 序 。Linux 
系统 非常 友好 ， 它 同时 支持 mknod 和 mkfifo 。 


在 程序 中 ， 我 们 可 以 使 用 两 个 不 同 的 函数 调用 ， 如 下 所 不: 


#include <sys/types.h> 
#include <sys/stat.h> 


int mkfifo(const char *filename, mode_t mode); 
int mknod(const char *filename, mode t mode | S IFIFO, (dev t) 0); 


与 mknod 命 令 一 样 ， 我 们 可 以 用 mknod 函 数 建立 许多 特殊 类 型 的 
文件 。 要 想 通 过 这 个 函数 创建 一 个 命名 管道 ， 唯 一 具有 可 移植 性 的 方 
法 是 使 用 一 个 dev_t 类 型 的 值 0， 并 将 文件 访问 模式 与 5_IFIFO 按 位 或 。 
我 们 在 下 面 的 例子 中 将 使 用 较 人 简单 的 mkfifo 函 数 。 


实 验 创建 命名 管道 
下 面 是 程序 fifol.c 的 代码 : 


res me 0) pri 
exitiEXIT SUCCESS! 


我 们 可 以 用 下 面 的 命令 来 创建 和 查找 管道 : 

注意 ， 输 出 结 末 中 的 第 一 个 字符 为 p， 表 示 这 是 一 个 管道 。 最 后 
的 | 符号 是 由 Is 命令 的 -选项 添加 的 ， 它 也 表示 这 是 一 个 管道 。 

实验 解析 

这 个 程序 用 mkfifo 函 数 创 建 一 个 特殊 的 文件 。 虽 然 我 们 要 求 的 文 
件 模 式 是 0777， 但 它 被 用 户 掩 码 (umask) 设置 (在 本 例 中 是 022) 给 
改变 了 ， 这 和 与 普通 文件 的 创建 站 一 样 的 ， 所 以 文件 的 最 终 模 式 是 755。 
如 果 你 的 掩 码 设置 与 这 里 不 同 ， 比 如 是 0002， 那 你 将 看 到 创建 的 文件 
拥有 一 个 不 同 的 权限 。 

我 们 可 以 像 删除 一 个 普通 文件 那样 用 rm 命令 删除 FIFO 文 件 ， 或 者 
也 可 以 在 程序 中 用 unlink 系 统 调用 来 删除 它 。 


13.6.1 访问 FIFO 


命名 管道 的 一 个 非常 有 用 的 特点 是 : 由 于 它们 出 现在 文件 系统 
中 ， 所 以 它们 可 以 像 平 第 的 文件 名 一 样 在 命令 中 使 用 。 在 把 创建 的 
FIFO 文 件 用 在 程序 设计 中 之 前 ， 我 们 先 通 过 普通 的 文件 命令 来 观察 
FIFO 文 件 的 行为 。 


实 验 访问 FIFO 文 件 | 
(1) 首先 ， 我们 来 尝试 读 这 个 ( 空 的 ) FIFO 文 件 : 
$ cat </tmp/my_fifo 
(2) ME, SI FIFOS SG o RAMA APA ia RET FE 
面 的 命令 ， 因 为 第 一 个 命令 现在 被 挂 起 以 等 待 数据 出 现在 FIFO 中 。 
$ echo “Hello World ”> /tmp/my_fifo 
你 将 看 到 cat 命 令 产 生 输 出 。 如 果 不 同 FIFO 发 送 任何 数据 ，cat 命 令 
将 一 直 挂 起 ， 直 到 你 中 断 它 ， 常 用 的 中 断 方 式 是 使 用 组 合 键 Ctrl+C。 


3) 我 们 可 以 将 第 一 个 命令 放 在 后 台 执行 ， 这 样 即 可 一 次 执行 两 


个 命令 
$ cat < /tmp/my fifo & 

[1] 1316 

$ echo "Hello World" » /tmp/my fifo 


Hello Worid 
[1]* Done cat «/tmp/my fifo 


实验 解析 

因为 FIFO 中 没有 数据 ， 所 以 cat 和 echo 程 序 都 阻塞 了 ，cat 等 竺 数据 
的 到 来 ， 而 echo 等 待 其 他 进程 读 取 数 据 。 

在 上 面 的 第 三 步 中 ，cat 进 程 一 开始 束 在 后 台 被 阻塞 了 ， 当 echo 癌 
它 提供 了 一 些 数据 后 ，cat 命 令 读 取 这 些 数据 并 把 它们 打印 到 标准 输出 
上 ， 然 后 cat 程 序 退出 ， 不 再 等 竺 更 多 的 数据 。 它 没有 阻塞 是 因为 当 第 
二 个 命令 将 数据 放 入 FIFO 后 ， 管 道 将 被 关闭 ， 所 以 cat 程 序 中 的 read 调 
用 返回 0 字 节 ， 表 示 已 经 到 达 文 件 尾 。 

现在 我 们 已 看 过 用 命令 行程 序 访问 FIFo 的 情况 ， 接 下 来 我 们 将 仔 
， 它 可 以 让 我 们 在 访问 FIFO 文 件 时 更 多 地 控制 
其 读 写 行为 。 


与 通过 pipe 调 用 创建 管道 不 同 ，FIFO 是 以 命名 文件 的 形式 存 
在 ， 而 不 是 打开 的 文件 描述 符 ， 所 以 在 对 它 进 行 读 写 操作 之 前 必 
须 先 打开 它 。FIFO 也 用 open 和 close 函 数 打 开 和 关闭 ， 这 与 我 们 前 
面 看 到 的 对 文件 的 操作 一 样 ， 但 它 多 了 一 些 其 他 的 功能 。 对 FIFO 
传递 给 open 调 用 的 是 FIFO 的 路 径 名 ， 而 不 是 一 个 正常 的 文 


1. 使 用 open 打 开 FIFO 文 件 

打开 FIFO 的 一 个 主要 限制 是 ， 程 序 不 能 以 O_RDWR 模式 打开 
FIFO 文 件 进行 读 写 操 作 ， 这 样 做 的 后 果 并 未 明确 定义 。 但 这 个 限制 是 
有 道理 的 ， 因 为 我 们 通常 使 用 FIFO 只 是 为 了 单 向 传递 数据 ， 所 以 没有 
必要 使 用 O_RDWR 模式 。 如 果 一 个 管道 以 读 / 写 方式 打开 ， 进 程 就 会 从 
这 个 管道 读 回 它 自 己 的 输出 。 

如 果 确 实 需要 在 程序 之 间 双 向 传递 数据 ， 最 好 使 用 一 对 FIFO 或 管 
道 ， 一 个 方 回 使 用 一 个 ， 或 者 (但 并 不 常用 ) 采用 先 关 闭 再 重新 打开 


FIFO 的 方法 来 明确 地 改变 数据 流 的 方向 。 我 们 将 在 本 章 后 面部 分 再 讨 
论 用 FIFO 进 行 双向 数据 交换 的 问题 。 
打开 FIFO 文 件 和 打开 普通 文件 的 男 一 点 区 别 是 ， 对 open_flag 
(open 函 数 的 第 二 个 参数 ) 的 O NONBLOCK 选 项 的 用 法 。 使 用 这 个 
选项 不 仅 改变 open 调 用 的 处 理 方 式 ， 还 会 改变 对 这 次 open 调 用 返回 的 
文件 摘 述 符 进 行 的 读 写 请 求 的 处 理 方 式 。 

O_RDONLY、O_WRONLY 和 O_NONBLOCK 标 志 共 有 4 种 合法 的 
组 合 方 式 ， 我 们 将 逐个 介绍 它们 。 

open (const char *path, O_ RDONLY) ; 

在 这 种 情况 下 ，open 调 用 将 阻塞 ， 除 非 有 一 个 进程 以 写 方式 打开 
同一 个 FIFO， 和 否则 它 不 会 返回 。 这 与 前 面 第 一 个 cat 命 令 的 例子 类 似 。 

open (const char *path, O_RDONLY | O NONBLOCK) ; 

即使 没有 其 他 进程 以 写 方式 打开 FIFO， 这 个 open 调 用 也 将 成 功 并 
立刻 返回 。 

open (const char *path, O WRONLY) ; 

在 这 种 情况 下 ，open 调 用 将 阻塞 ， 直 到 有 一 个 进程 以 读 方 式 打开 
同一 个 FIFO 为 止 。 

open (const char *path, O_WRONLY | O NONBLOCK) ; 

这 个 函数 调用 总 是 立刻 返回 ， 但 如 果 没 有 进程 以 读 方 式 打 开 FIFO 
文件 ，open 调 用 将 返回 一 个 错误 -1 并 且 FIFO 也 不 会 被 打开 。 如 果 确 实 
有 一 个 进程 以 读 方 式 打 开 FIFO 文 件 ， 那 么 我 们 就 可 以 通过 它 返 回 的 文 
件 描 述 符 对 这 个 FIFO 文 件 进行 写 操 作 。 


请 注意 O_NONBLOCK 分 别 搭配 O_RDONLY 和 O_WRONLY 
在 效果 上 的 不 同 ， 如 果 没 有 进程 以 读 方式 打开 管道 ， 非 阻塞 写 方 
式 的 open 调 用 将 失败 ， 但 非 阻塞 读 方式 的 open 调 用 总 是 成 功 。 
close 调 用 的 行为 并 不 受 O_NONBLOCK 标 志 的 影响 。 


实 验 打开 FIFO 文 件 
下 面 我 们 来 看 ， 如 何 通过 使 用 带 0 NONBLOCK 标 志 的 open 调 用 的 
行为 来 同步 两 个 进程 。 我 们 在 这 里 并 没有 选择 使 用 多 个 示例 程序 的 做 
法 ， 而 是 只 使 用 一 个 测试 程序 fifo2.c， 通 过 给 该 程序 传递 不 同 的 参数 
的 方法 来 观察 FIFO 的 行为 。 
(1) 程序 的 开始 部 分 是 头 文 件 和 #define 定 义 ， 然 后 检查 是 否 在 命 
令 行 提 供 了 正确 数目 的 参数 : 


if a 


"ómhinar 


w T O0 NONBLOCK»n* *arg 


(2) 假设 程序 已 通过 测试 ， 现 在 我 们 根据 命令 行 参数 来 设置 
open_mode 的 值 : 


strnony OF 
open mod RDONL! 
gtrncsp arg WE 
ape ONLY 
etruces arg ) NON 
ope WEL 


(3) 现在 检查 FIFO 文 件 是 否 存 在 ， 如 有 必要 就 创建 它 。 接 下 来 
do SL ERRORI 然后 程序 小 器 一 人 下。 最 后 ， 关 
HjFIFO ° 


FIFO NAME 
eir FIF 


实验 解析 

这 个 程序 能 够 在 命令 行 上 指定 我 们 和 希望 使 用 的 O RDONLY ` 
O_WRONLY 和 O_NONBLOCK 的 组 合 方式 。 它 会 把 命令 行 参 数 与 程序 
中 的 常量 字符 串 进行 比较 ， 如 果 匹 配 ， 就 《用 |= 操 作 符 ) 设置 相应 的 
T 。 程序 用 access 函 数 来 检查 FIFO 文 件 是 否 存 在 ， 如 果 不 存 在 就 创 
建 它 。 


在 程序 中 ， 一 直到 最 后 都 没有 删除 这 个 FIFO 文 件 ， 因 为 我 们 没 办 
法 知道 是 否 有 其 他 程序 正在 使 用 它 。 


2. 不 带 O_NONBLOCK 标 志 的 O_RDONLY 和 0 一 WRONLY 
我 们 现在 有 了 测试 程序 ， 可 以 逐个 尝试 标志 的 不 同 组 合 方式 。 注 
， 我 们 将 第 一 个 程序 ( 读 取 者 ) 放 在 后 台 运 行 : 
S ./fifo2 O RDONLY & 
[1] 152 
Process 152 opening FIFO 
$ ./fifo2 O WRONLY 
Process 153 opening FIFO 
Process 152 result 3 
Process 153 result 3 
Process 152 finished 


Process 153 finished 

这 可 能 是 命名 管道 最 常见 的 用 法 了 。 它 允许 先 启动 读 进 程 ， 
并 在 open 调 用 中 等 待 ， 当 第 二 个 程序 打开 FIFO 文 件 时 ， 两 个 程序 
继续 运行 。 注 意 ， 读 进程 和 写 进 程 在 open 调 用 处 取得 同步 。 


当 一 个 Linux 进 程 被 阻塞 时 ， 它 并 不 消耗 CPU 资源 ， 所 以 这 种 
进程 的 同步 方式 对 CPU 来 说 是 非常 有 效率 的 。 


3. ff O NONBLOCK 标志 的 O RDONLY 和 不 带 该 标志 的 
O WRONLY 


这 次 ， 读 进程 执行 open 调 用 并 立刻 继续 执行 ， 即 使 没有 写 进 程 的 


存在 。 随 后 写 进程 开始 执行 ， 它 也 在 执行 open 调 用 后 立刻 继续 执行 ， 
但 这 次 是 因为 FIFO 已 被 读 进程 打开 。 


ca 


fifo2 O RDONLY O NONBLOCK & 


fifo2 O WRONLY 


这 两 个 例子 可 能 是 open 模 式 的 最 常见 的 组 合 形式 。 你 还 可 以 用 这 
个 示例 程序 随意 尝试 其 他 组 合 方式 。 


4. 对 FIFO 进 行 读 写 操作 


使 用 O_NONBLOCK 模 式 会 影响 到 对 FIFO 的 read 和 write 调用 。 

对 一 个 空 的 、 阻 塞 的 FIFO ( 即 没 有 用 O_NONBLOCK 标 志 打 开 ) 
的 read 调 用 将 等 待 ， 直 到 有 数据 可 以 读 时 才 继 续 执行 。 与 此 相反 ， 对 
一 个 空 的 、 非 阻塞 的 FIFO 的 read 调 用 将 立刻 返回 0 字 节 。 

对 一 个 完全 阻塞 FIFO 的 write 调用 将 等 待 ， 直 到 数据 可 以 被 写 入 时 
才 继 续 执行 。 如 果 FIFO 不 能 接收 所 有 写 入 的 数据 岂 -， 它 将 按 下 面 的 
规则 执行 。 

o ”如 果 请 求 写 入 的 数据 的 长 度 小 于 等 于 PIPE_BUF 字 节 ， 调 用 失 

败 ， 数 据 不 能 写 入 。 

O ”如果 请 求 写 入 的 数据 的 长 度 大 于 PIPE_BUF 字 广 ， 将 写 入 部 分 

数据 ， 返 回 实际 写 入 的 字 节 数 ， 返 回 值 也 可 能 是 0。 

FIFO 的 长 度 是 需要 考虑 的 一 个 很 重要 的 因素 。 系 统 对 任 一 时 刻 在 
一 个 FIFO 中 可 以 存在 的 数据 长 度 是 有 限制 的 。 它 由 #define PIPE BUF 
语句 定义 ， 通 常 可 以 在 头 文件 ]limits.h 中 找到 它 。 在 Linux 和 许多 其 他 类 
UNIX 系 统 中 ， 它 的 值 通常 是 4 096 字 节 ， 但 在 某 些 系统 中 它 可 能 会 小 
到 512 字 节 。 系 统 规定 :; 在 一 个 以 0O_WRONLY 方 式 〈 即 阻塞 方式 ) 打 
开 的 FIFO 中 ， 如 果 写 入 的 数据 长 度 小 于 等 于 PIPE_BUF， 那 么 或 者 写 
入 全 部 字 节 ， 或 者 一 个 字 节 都 不 写 入 。 

虽然 ， 对 只 有 一 个 FIFO 写 进程 和 一 个 FIFO 读 进程 的 简单 情况 来 
说 ， 这 个 限制 并 不 是 非常 重要 ， 但 只 使 用 一 个 FIFO 并 允许 多 个 不 同 的 
程序 向 一 个 FIFO 读 进程 发 送 请 求 的 情况 是 很 常见 的 。 如 果 几 个 不 同 的 
程序 尝试 同时 向 FIFO 写 数据 ， 能 否 保 证 来 自 不 同 程序 的 数据 块 不 相互 
交错 就 非常 关键 了 。 也 就 是 说 ， 每 个 写 操 作 都 必须 是 “原子 化 ”的 。 怎 
样 才能 做 到 这 一 点 呢 ? 


如 果 你 能 保证 所 有 的 写 请 求 是 发 往 一 个 阻塞 的 FIFO 的 ， 并 且 每 个 
写 请 求 的 数据 长 度 小 于 等 于 PIPE_BUF 字 节 ， 系 统 就 可 以 确保 数据 决 不 
会 交错 在 一 起 。 通 常 将 每 次 通过 FIFO 传递 的 数据 长 度 限 制 为 
PIPE_BUF 字 六 是 个 好 方法 ， 除 非 你 只 使 用 一 个 写 进程 和 一 个 读 进 程 。 


X 验 使 用 FIFO 实 现 进 程 间 通信 
为 了 演示 不 相关 的 进程 是 如 何 使 用 命名 管道 进行 通信 和 的， 我 们 需 
要 用 到 两 个 独立 的 程序 fifo3.c 和 fifo4.c。 
(1) 第 一 个 程序 是 生产 者 程序 。 它 在 需要 时 创建 管道 ， 然 后 尽 可 
能 快 地 加 管道 中 写 入 数据 。 


注意 ， 出 于 演示 的 目的 ， 我 们 并 不 关心 写 入 数据 的 内 容 ， 所 
以 我 们 并 未 对 缓冲 区 进行 初始 化 。 在 这 两 个 程序 代码 中 ， 与 
ee 处 理 命令 行 参数 的 代码 被 删 


printf('Process td opening FIFO O_WRONLY\n", getpid()); 
pipe_fd = open(FIFO_NAME, open_mode) ; 
printf(*Process $d result $dWn', getpid(), pipe fd): 


if (pipe fd != -1) ( 
while(bytes sent « TEN MEG) ( 
res - write(pipe fd, buffer, BUFFER SIZE); 
if (res == -1) { 
fprintf(stderr, "Write error on pipe\n"); 


exit (EXIT_FAILURE) ; 
ER += res; 
Ue Eng, her 
nu { 
exit (EXIT_FAILURE) ; 


printf("Process $d finished\n", getpid()); 
exit (EXIT_SUCCESS) ; 


(2) 第 二 个 程序 是 消费 者 程序 ， 它 的 代码 要 简单 得 多 ， 它 从 
FIFO 读 取 数 据 并 丢弃 它们 。 


$include <unistd.h> 
finclude <stdlib.h> 
tinclude <stdio.h> 
include <string.h> 
@include «fcntl.hs 
#include «limits.h» 
finclude <sys/types.h> 
$include «sys/stat.h» 


tdefine FIPO NAME *jtep/my, fi fo* 
(define BUFFER SIZE PIPE BUF 


int maini) 


int pipe. fd: 

int res: 

int open mode = 0. RDONLY; 
char buffer[BUFFER SIZE + 1}; 
int bytes read * 0; 


memset(buffer, 'i0', sizeof (buffer) 17 

printf (*Proceas td opening FIFO O_RDONLY\n‘, getpid()): 
pipe_fd = open(FIFO_NAME, open_mode): 

printf(*Process td result d\n", getpid(), pipe fd); 


if ipipe.fd != -1) [ 


res = read(pipe_td, buffer, BUFFER_SIZE) 


Process td finished, td bytes readin", getpid(!. bytes_read) ; 


我 们 在 运行 这 两 个 程序 的 同时 ， 用 time 命 令 对 读 进 程 进行 计时 。 
输出 结果 如 下 所 示 (为 简洁 起 见 ， 对 结果 做 了 一 些 修改 ) : 

$ ./fifo3 & 

[1] 375 

Process 375 opening FIFO O_WRONLY 

$ time ./fifo4 

Process 377 opening FIFO O RDONLY 

Process 375 result 3 

Process 377 result 3 

Process 375 finished 

Process 377 finished, 10485760 bytes read 


real 0m0.053s 

user 0m0.020s 

sys 0m0.040s 

[1]* Done ./fifo3 
Ro 

实验 解析 


两 个 程序 使 用 的 都 是 阻塞 模式 的 FIFO。 我 们 首先 启动 fifo3 (5t 
程 /生产 者 ) ， 它 将 阻塞 以 等 待 读 进程 打开 这 个 FIFO。fifo4 GHA) 
启动 以 后 ， 写 进程 解除 阻塞 并 开始 向 管道 写 数 据 。 同 时 ， 读 进程 也 开 
始 从 管道 中 读 取 数据 。 


Linux 会 安排 好 这 两 个 进程 之 间 的 调度 ， 使 它们 在 可 以 运行 的 
时 候 运 行 ， 在 不 能 运行 的 时 候 阻 塞 。 因 此 ， 写 进程 将 在 管道 满 时 
阻塞 ， 读 进程 将 在 管道 宪 时 阻塞 。 


time 命 令 的 输出 显示 ， 读 进程 只 运行 了 不 到 0.1 秒 的 时 间 ， 却 读 取 
了 10MB 的 数据 。 这 说 明 管道 〈 至 少 在 现代 Linux 系 统 中 的 实现 ) 在 程 
序 之 间 传 递 数 据 是 很 有 效率 的 。 


作为 学 习 FIFO 的 最 后 一 部 分 内 容 ， 我 们 来 考虑 怎样 通过 命名 管道 
来 编写 一 个 非常 简单 的 客户 /服务 顺应 用 程序 。 我 们 想 只 用 一 个 服务 天 
a T EE 

我 们 想 允 许多 个 客户 进程 都 可 以 同 服务 器 发 送 数 据 。 为 了 使 问题 
简单 化 ， 我 们 假设 被 处 理 的 数据 可 以 被 拆 分 为 一 个 个 数据 块 ， 每 个 的 
长 度 都 小 于 PIPE_BUF 字 用 。 当 然 ， 我 们 可 以 用 很 多 方法 来 实现 这 个 系 
a 
VF o 


ALA ARS ae EAR BEAR PETER, Pr AREH — 1 FIFORGX 
是 合乎 逻辑 的 ， 服 务 器 通过 它 读 取 数 据 ， 每 个 客户 向 它 写 数据 。 只 
将 FIFO 以 阻塞 模式 打开 ， 服 务 器 和 客户 就 会 根据 需要 自动 被 阻塞 。 

将 处 理 后 的 数据 返回 给 客户 稍微 有 些 困难 。 我 们 需要 为 每 个 客户 
安排 第 二 个 管道 来 接收 返回 的 数据 。 通 过 在 传递 给 服务 器 的 原先 数据 
中 加 上 客户 的 进程 标识 符 (PID) ， 双 方 就 可 以 使 用 它 来 为 返回 数据 
的 管道 生成 一 个 唯一 的 名 字 。 


X 验 一 个 客户 /服务 器 应 用 程序 的 例子 
(1) 首先 ， 我 们 需要 一 个 头 文件 clienth， 它 定义 了 客户 和 服务 器 
。 为 了 方便 使 用 ， 它 还 包含 了 必要 的 系统 头 文 


(2) 现在 是 服务 器 程序 server.c。 在 这 一 部 分 ， 我 们 创建 并 打开 
服务 器 管道 。 它 被 设置 为 只 读 的 阻塞 模式 。 在 稍 作 休 乱 (这 是 出 于 演 


示 的 目的 ) 之 后 ， 服 务 器 开始 读 取 客户 发 送 来 的 数据 ， 这 些 数据 采用 


的 是 data_to_pass_st 结 构 。 


(3) 在 接 下 来 的 这 一 部 分 中 ， 我 们 对 刚 从 客户 那里 读 到 的 数据 进 
行 处 理 ， 把 some_data 中 的 所 有 字符 全 部 转换 为 大 写 ， 并 且 把 
CLIENT_FIFO_NAME 和 接收 到 的 client_pid 结 合 在 一 起 。 


(4) 然后 ， 我 们 以 只 写 的 阻塞 模式 打开 客户 管道 ， 把 经 过 处 理 的 
数据 发 送 回去 。 最 后 ， 关 闭 服务 如 管道 的 文件 接 述 符 ， 删 除 FIFO 文 


(5) 下 面 是 客户 程序 client.c。 这 个 程序 的 第 一 部 分 先 检查 服务 器 
FIFO 文 件 是 否 存 在 ， 如 果 存 在 就 打开 它 。 然 后 它 获 取 自 己 的 进程 ID， 
该 进程 ID 构成 要 发 送 给 服务 器 的 数据 的 一 部 分 。 接 下 来 ， 它 创建 客户 
FIFO， 为 下 一 部 分 内 容 做 好 准备 。 


Hn ag 


HE 


main 
int server fifo fd, ciient fifo fd: 
struct data to pass st my data; 
nt times, to rend 
ha ient E a 
server fifo fd = opéen([SERVER FIFO NAME, O WRONLY) 
é (server fito fd == -1) 


fprintf|stderr, "Sorry, no server'n'!; 
exit|EXIT FAILURE 
) 
my_data.client_pid = getpid(]i 
sprintf[client fifo, CLIENT FIFO NAME, my data.cliant pid); 
if (mkfifolclient fifo, 0777) == -1) ( 


fprintf(stderr, “Sorry, can't make s\n", client fifo); 
exit|EXIT FAILURE); 
} 


(6) 这 部 分 有 5 次 循环 ， 在 每 次 循环 中 ， 客 户 将 数据 发 送 给 服务 
然后 打开 客户 FIFO (只 读 ， 阻 塞 模式 ) 并 读 回 数据 。 在 程序 的 最 
关闭 服务 器 FIFO 并 将 客户 FIFO 从 文件 系统 中 删除 。 


for [times to send = 0: times to send < 5; times_to_send++) I 
sprintfimy data.some data, “Hello from $4", my data.client pid): 
printf(**d sent ùs, *, my data.client pid, my.data.some data); 
write(server fifo fd, &my data, sizeof (mydata)); 
client fifo fd = open(client fifo, O RDONLY); 
if (client fifo. fd f= -1) { 

if (read(client fifo fd, &my data, sizeof(my.data]) > 0) ( 
printf('received: $s\n*, my data.gome data): 

) 

closeiclient fifo fd); 


H 
close[server fifo fd); 
unlinkiclient fifo|; 
exit (EXIT SUCCESS! | 


测试 这 个 程序 时 ， 我 们 需要 运行 一 个 服务 器 程序 和 多 个 客户 程 
为 了 让 多 个 客户 程序 尽 可 能 在 同一 时 间 局 动 ， 我 们 使 用 如 下 所 示 


的 shell 命 令 : 


531 
532 
529 
530 
531 
532 


sent Hello from 531, received: HELLO FROM 531 
sent Hello from 532, received: HELLO FROM 532 
sent Hello from 529, received: HELLO FROM 529 
sent Hello from 530, received: HELLO FROM 530 
sent Hello from 531, received: HELLO FROM 531 
sent Hello from 532, received: HELLO FROM 532 


Ek urT — B SIIERUNISA TE PHIERE » A PUSH ITF 


Bras (为 了 简洁 起 见 ， 我 们 做 了 一 些 修改 ) : 


1 sent Hel om 531, rec ed: HELLO FROM 531 
32 sent Hell: rom 532, received: HELLO FROM 532 
9 sent Hello from 529, received: HELLO FROM 529 
5 ent Hell: om 530, received: HELLO FROM 530 
1 sent Hell om 531 eceived: HELLO FROM 531 
532 sent Hello from eived: HELLO FROM 532 


如 你 所 见 ， 不 同 的 客户 请 求 交 错 在 一 起 ， 但 每 个 客户 都 获得 了 正 
确 的 服务 器 返回 给 它 的 处 理 数据 。 要 注意 的 是 客户 请 求 的 交错 顺序 是 
随机 的 ， 服 务 需 接收 到 客户 请 求 的 顺序 随机 器 的 不 同 而 不 同 ， 即 使 是 
在 同一 台 机 器 上 ， 每 次 运行 的 情况 也 可 能 发 生变 化 。 

实验 解析 

现在 ， 我 们 将 解释 客户 和 服务 器 在 交互 时 各 种 操作 的 执行 顺序 ， 
这 是 我 们 以 前 未 涉及 的 。 

服务 器 以 只 读 模 式 创建 它 的 FIFO 并 阻塞 ， 直 到 第 一 个 客户 以 写 方 
式 打开 同一 个 FIFO 来 建立 连接 为 止 。 此 时 ， 服 务 右 进程 解除 阻 窟 并 执 
行 sleep 语 句 ， 这 使 得 来 目 客 户 的 数据 排队 等 候 。 在 实际 的 应 用 程序 
中 ， 应 该 把 sleep 语 句 删 除 。 我 们 在 这 里 使 用 它 只 是 为 了 演示 当 有 多 个 
客户 的 请 求 同 时 到 达 时 ， 程 序 的 正确 操作 方法 。 

与 此 同时 ， 在 客户 打开 了 服务 器 FIFO 后 ， 它 创建 自己 唯一 的 一 个 
命名 管道 来 读 取 服 务 硕 返回 的 数据 。 完 成 这 些 工 作 后 ， 客 户 发 送 数据 
给 服务 器 〈 如 果 管 道 满 或 服务 响 仍 在 休眠 中 就 阻塞 ) ， 然 后 阻塞 在 对 
目 己 的 FIFO 的 read 调 用 上 ， 等 待 服务 器 的 啊 应 。 

接收 到 来 目 客户 的 数据 后 ， 服 务 絮 处 理 它 ， 然 后 以 写 方式 打开 客 
户 管道 并 将 处 理 后 的 数据 返回 ， 这 将 解除 客户 的 阻塞 状态 。 客 户 被 解 
除 阻 塞 后 ， 它 即 可 从 自己 的 管道 中 读 取 服 务 需 返回 的 数据 。 

整个 处 理 过 程 不 断 重 复 ， 直 到 最 后 一 个 客户 关闭 服务 右 管 道 为 
止 ， 这 将 使 服务 器 的 read 调 用 失败 (返回 9) ， 因 为 已 经 没有 进程 以 写 
方式 打开 服务 套 管 道 了 。 如 果 这 是 一 个 真正 的 服务 硕 进 程 ， 它 还 需要 
dd 的 请 求 ， 我 们 就 需要 对 它 进 行 修改 ， 有 两 种 方法 ， 如 下 

ZR œ 

D WER CHARA aE ETA AARS, ready Hd Tf 

总 是 阻塞 而 不 是 返回 0。 

口 “ 当 read 调 用 返回 0 时 ， 关 闭 并 重新 打开 服务 器 管道 ， 使 服务 壤 
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在 看 过 如 何 用 命名 管道 来 实现 一 个 人 简单 的 客户 /服务 器 系统 后 ， 我 
们 将 重新 阅读 CD 数据 库 应 用 程序 ， 并 据 此 对 它 进行 改 进 。 我 们 还 将 添 
加 一 些 信号 处 理 内 容 ， 使 我 们 可 以 在 进程 被 中 断 时 执行 一 些 清 理工 
作 。 为 了 使 代码 尽 可 能 简单， 我 们 将 使 用 早期 的 只 有 一 个 命令 行 接 口 
的 dbm 版 本 。 

在 深入 人 研究 这 个 新 版 本 之 前 ， 先 来 编译 这 个 新 的 应 用 程序 。 如 果 
你 已 经 从 网 站 上 下 载 了 源 代码 ， 束 可 以 用 makefile 将 它 编译 为 server 和 
client 这 两 个 程序 。 


第 7 革 讲 过 ， 不 同 的 Linux 发 行 版 命名 和 安装 dbm 文 件 的 方式 
略微 不 同 。 如 采 我 们 提供 的 文件 不 能 在 你 的 系统 中 成 功 编译 ， 请 
回顾 第 7 草 有 关 dbm 文 件 命名 和 位 置 的 内 容 。 


键入 命令 server-i， 将 使 程序 初始 化 一 个 新 的 CD 数据 库 。 
不 用 说 ， 如 果 服 务 亏 未 司 动 运行 ,客户 程序 是 不 会 运行 的 。 下 面 
征 makefile 文 件 的 内 容 ， 它 显示 了 程序 是 如 何 组 织 在 一 起 的 : 


pp.. pul d data.h 
d d à dbm 1 dara.h 
lie clier c cd dat 
pipe je pipe c ja 
Tai : eh di 
int 
> do P pipe. 
rve ap D. 
$ L$ M PATH LA ç 
De 
ean: 
r app 


13.7.1 目标 


我 们 的 目标 是 把 这 个 应 用 程序 中 处 理 数据 库 的 部 分 和 用 户 界 面部 
分 分 开 。 我 们 还 希望 只 运行 一 个 服务 器 进程 ， 但 允许 存在 许多 并 发 的 
客户 进程 。 我 们 将 尽量 减少 对 已 有 代码 的 修改 ， 只 要 有 可 能 ， 束 傈 留 
原 有 的 代码 。 

为 了 简化 应 用 ， 我 们 还 希望 能 够 在 应 用 程序 中 创建 《和 删除 ) € 
这 样 束 无 需 让 系统 管理 员 在 运行 程序 之 前 为 我 们 创建 命名 管道 


还 有 一 点 非 第 重要 ， 束 是 我 们 决 不 能 “ 忙 等 每 ” 某 个 事件 的 发 生 ， 
从 而 减少 CPU 时 间 的 当 费 。 正 如 我 们 看 到 的 ，Linux 介 许 我 们 阻塞 以 等 
竺 事件 的 发 生 ， 从 而 避免 消耗 很 多 系统 资源 。 我 们 可 以 利用 管道 的 阻 
塞 特 性 来 确保 对 CPU 的 有 效 使 用 。 总 之 ， 服 务 万 至 少 在 理论 上 可 以 在 
客户 请 求 到 来 之 前 等 竺 许多 个 小 时 。 


13.7.2 ”实现 


在 第 7 章 这 个 应 用 程序 的 早期 单 进程 版 本 中 ， 我 们 用 一 组 数据 访问 
例 程 来 处 理 数据 ， 它 们 是 : 


ILADAEB 
taba 
ry cha: 1 catalog ptr 
ry ha 1 catalogs 
ed ry ry.to add): 
-ca y ry to 8 
od g_ptr 
cd 1 ptr 
entry y cd, cat g 
all pt 


这 些 画 数 提供 了 一 个 方便 的 起 点 ， 让 我 们 可 以 把 客户 和 服务 器 两 
部 分 清楚 地 分 开 。 

这 个 应 用 程序 的 单 进程 实现 版 本 虽然 被 编译 为 一 个 单独 的 程序 
但 我 们 可 以 把 它 看 作 是 由 两 部 分 组 成 的 ， 如 图 13-6 所 示 。 


数据 访问 例 程 


数据 库 访 问 


Al 13-6 


在 客户 /服务 大 实现 版 本 中 ， 我 们 想 在 这 个 应 用 程序 的 两 个 主要 部 
a o 图 13-7 显 示 了 我 们 需要 

在 具体 实现 中 ， 我 们 选择 把 客 望 和 服务 器 的 接口 例 程 都 放 在 同一 
个 文件 pipe_imp.c 中 。 这 就 把 在 客户 /服务 器 实 现 版 本 中 依赖 命名 管道 
使 用 的 所 有 代码 都 集中 到 一 个 文件 中 。 而 将 传递 数据 的 格式 和 打包 方 
式 与 实现 命名 管道 的 例 程 分 离开 。 痢 版 本 中 所 包含 的 源 文 件 更 多 了 ， 
区 分 也 更 符合 逻辑 了 。 这 个 应 用 程序 的 调用 结构 如 图 13- 
BATA ° 


图 13-7 


文件 app_ui.c、dlient_if.c 和 pipe_imp.c 将 被 编译 和 链接 在 一 起 构成 
客户 端 程序 。 而 文件 cd_dbm.c、serverc 和 pipe_imp.c 将 被 编译 和 链接 在 
一 起 构成 服务 器 程序 。 头 文件 cliservh 将 以 一 个 公共 定义 头 文件 的 形式 
把 这 两 者 联系 在 一 起 。 

文件 app_ui.c 和 cd_dbm.c 只 做 了 少许 改动 ， 主 要 是 为 了 把 它 分 离 为 
两 个 程序 。 由 于 这 个 应 用 程序 现在 已 变 得 很 大 了 ， 而 代码 中 的 绝 大 部 
分 和 以 前 的 版 本 相 比 并 无 改动 ， 所 以 我 们 在 这 里 只 显示 文件 cliserv.h ` 
client_if.c 和 pipe_imp.c 中 的 代码 ° 


这 个 文件 的 某 些 部 分 依赖 于 客户 /服务 器 的 具体 实现 ， 在 本 例 
中 就 是 命名 管道 。 在 第 14 章 的 结尾 ， 我 们 还 将 改 用 男 一 种 不 同 的 
客户 /服务 器 模型 。 
头 文件 cliserv.h 


我 们 首先 来 看 头 文件 cliservh。 这 个 文件 定义 了 客户 /服务 器 接 
口 。 客 户 和 服务 万 的 实现 中 都 要 用 到 它 。 


(1) 首先 是 需要 包含 的 头 文件 : 


(2) 接着 是 命名 管道 的 定义 。 我 们 为 服务 器 设置 一 个 管道 ， 为 每 
个 客户 分 别 设置 一 个 管道 。 因 为 可 能 会 有 多 个 客户 ， 所 以 客户 管道 的 
名 字 中 要 加 上 它 的 进程 ID， 来 确保 管道 名 字 的 唯一 性 


(3) 我 们 将 命令 实现 为 枚 举 类 型 ， 而 不 是 #define 常 量 。 

使 用 枚 举 类 型 是 个 好 方法 ， 它 允许 编译 右 进 行 更 多 的 类 型 检查 并 
且 有 利于 软件 调试 。 因 为 许多 调试 万 可 以 显示 枚 举 常 量 的 名 字 ， 但 对 
由 #define 指 令 定义 的 名 字 束 不 行 。 

第 一 个 typedef 给 出 了 发 送 给 服务 器 的 请 求 类 型 ， 第 二 个 给 出 了 服 
务 器 返回 给 客户 的 啊 应 类 型 。 


fine RE 


(4) 接 下 来 ， 我 们 声明 了 一 个 结构 ， 用 来 在 两 个 进程 之 间 进 行 双 
向 传递 消息 。 


为 我 们 无 需 在 同一 个 啊 应 中 同时 返回 cdc_entry 和 
cdt_entry， 所 以 也 可 以 用 联合 变量 的 形式 将 它们 结合 在 一 起 。 但 
出 于 简化 问题 的 考虑 ， 我 们 还 是 将 它们 分 离开 来 ， 这 也 使 得 代码 
更 易于 维护 。 


er 


(5) 最 后 是 执行 数据 传输 工作 的 管道 接口 函数 ， 它 的 具体 实现 在 
文件 pipe_imp.c 中 。 它 们 分 为 服务 器 端 男 数 和 客户 端 男 数 两 组 ， 分 别 列 
在 下 面 的 第 一 部 分 和 第 二 部 分 : 


”我 们 将 下 面 的 讨论 分 为 两 部 分 ， 一 部 分 介绍 客户 接口 钞 数 ， 男 一 
部 分 介绍 在 文件 pipe_ imp.c 中 的 服务 硕 端 和 客户 端 画 数 的 实现 细节 ， 我 
们 会 在 必要 时 给 出 源 代 码 。 


13.7.3 O 


现在 我 们 来 看 文件 client_if.c。 它 提供 了 “ 假 ” 版 本 的 数据 库 访问 例 
程 。 这 些 例 程 对 请 求 进行 编码 并 将 它 放 入 message_db_t 结 构 ， 然 后 使 
用 pipe_imp.c 中 的 例 程 将 请 求 传 输 给 服务 器 。 这 样 可 以 尽量 减少 对 原来 
的 app_ui.c 文 件 的 改动 。 


1. 客 户 命令 解释 器 


(1) 这 个 文件 实现 了 在 头 文 件 cd_data.h 中 定义 的 9 个 数据 库 范 
数 。 它 的 作用 如 同 古 一 个 中 转 站 ， 先 把 请 求 传 递 给 服务 器 ， 然 后 从 男 
数 返 回 服务 右 的 啊 应 。 它 的 开始 部 分 是 #include 语 句 和 常量 的 定义 : 


Sdefine POSIX 


cO Gat! 
m A P1 d maed . 
anc.ude CALZBEIV.n 


(2) BIG 22 etmypidia/> T X getpid EX Bx A Yel H AKZ o Jy T YR ER 
重复 代码 ， 我 们 使 用 了 局 部 函数 read_one_response: 


(3) 画 数 database_initialize 和 close 仍 被 使 用 ， 但 与 以 往 不 同 ， 它 
们 一 个 用 来 初始 化 管道 接口 的 客户 端 ， 一 个 用 来 删除 当 客户 退出 时 多 


余 的 命名 管道 : 


mid 


(4) FA —8 28 EA CDA A ERAY H get_cde_entry HE, MARE E 

中 取出 对 应 的 标题 数据 项 。 我 们 将 请 求 编码 到 一 个 message_db_{t 结 构 

中 并 把 它 传递 给 服务 器 ， 然 后 将 服务 絮 的 响应 读 回 到 男 一 个 

message_db_t 结 构 中 。 如 果 在 数据 库 中 找到 了 对 应 的 数据 项 ， 它 将 被 

po UD 的 cdc_entry 结 构 中 ， 我 们 把 该 结构 作为 函数 
351 ; 


us 下 面 是 函数 read_one_response 的 源 代 码 ， 我 们 用 它 来 避免 重 
复 代 码 : 


static int read one response (message db t *rec ptr) { 


(6) 其 他 get_xxx、del xxx 和 add_xxx 形 式 的 例 程 与 get_cdc_entry 
函数 的 实现 方式 类 似 。 为 了 代码 的 完整 性 ， 我 们 也 把 它们 列 在 下 面 ， 
首先 是 用 来 检索 CD 曲目 的 函数 get_cdt_entry: 


(7) 接 下 来 是 两 个 添加 数据 的 函数 ， 第 一 个 用 于 标题 数据 库 ， 第 
二 个 用 于 曲目 数据 库 : 


if [send mess to server[mess send)) ( 
if (read one response(&mess ret)] | 
if [mess ret.reaponse == r success) ( 
return(1]; 
) eise [ 
fprintf(stderr, “Ng, mess ret.error text]; 
) 
) eise [ 
fprintf (stderr, "Server failed to respond\n"); 
) 
) else | 
fprintf(stderr, "Server not accepting requestain']: 
} 
retürn(0)7 


add cdt entry|conunst cdt entry entry to ad4) 


message db t mess send; 
message db t mess ret; 


mess send.client pid = mypid; 
mess send. request = s add cdt entry; 
mess send.cdt entry data = entry to add; 


if (send mess to smerveri(mess send]) 工 
if (read one responseí&ámess ret]] | 
if (mess ret.response == r success) (| 
zeturn(1]; 
) else ( 
fprintf(stderr, **s*, mess ret.error text|:; 
) 
] else { 
fprintf(stderr, ‘Server falled to respondin']; 
) 
) eise ( 
fprintf(stderr, "Server not accepting requestsin"]; 


) 
return(0) ; 


(8) 最 后 是 两 个 用 于 删除 数据 的 函数 : 


int del sdc.entry!const char *cd catalog ptr) 


t 


message db t mess send; 
message do t mess ret; 


mesa send.client pid = mypid; 
pess send.request + s del cdc entry; 
&trcpy(mess send.cdc entry data.catajlog, cd catalog ptr: 


if (send mess to serverímess eend)] { 
if (read one response[&mess reti) { 


2. 搜 索 数 据 库 


根据 CD 唱片 关键 字 进 行 搜索 的 函数 非常 复杂 。 调 用 者 和 硕 望 每 调用 
它 一 次 惑 开始 一 次 搜索 。 在 第 7 章 中 ， 为 了 满足 这 种 需求 ， 在 第 一 次 调 
用 该 男 数 时 将 *first_call_ptr 设 置 为 tue， 这 样 它 将 返回 第 一 个 匹配 记 
孙 。 在 后 续 对 搜索 函数 的 调用 中 ， 我 们 将 *first_call ptr 设置 为 false， 
这 样 它 返 回 的 是 后 续 的 匹配 记录 ， 每 次 调用 返回 一 个 。 

现在 ， 由 于 我 们 已 将 应 用 程序 划分 为 两 个 进程 ， 在 服务 器 中 就 不 
能 再 允许 每 次 搜索 只 处 理 一 个 数据 项 了 ， 因 为 在 前 一 次 搜索 正在 进行 
时 ， 可 能 会 有 另 一 个 客户 开始 请 求 服务 器 进行 另外 一 次 搜索 。 我 们 也 
不 能 让 服务 器 端 分 别 保存 每 个 客户 搜索 的 上 下 文 〈 即 搜索 已 到 达 的 位 
置 ) ， 因 为 用 户 可 能 会 在 搜索 进行 到 一 半 时 ， 由 于 找到 了 想 找 的 CD 唱 
片 或 因为 客户 突然 中 断 而 停止 这 次 搜索 。 

我 们 可 以 改变 搜索 的 执行 方式 ， 也 可 以 像 我 们 在 这 里 选择 的 那样 
把 这 些 复杂 性 隐藏 在 接口 例 程 中 。 我 们 的 做 法 是 ， 让 服务 器 把 搜索 的 


可 能 匹配 结 采 全 部 返回 并 保存 在 一 个 临时 文件 中 ， 直 到 客户 请 求 它 


fi] ° 

(1) 这 个 函数 看 上 去 很 复杂 ， 但 实际 并 非 如 此 。 它 调用 了 3 个 管 
道 函 数 〈 我 们 将 在 下 一 节 中 介绍 它们 ) : send mess to server ` 
start_resp_from_server 和 read_resp_from_server。 


(2) 第 一 次 调用 这 个 函数 进行 搜索 时 ，*first_call ptr 被 设置 为 
true。 我 们 最 好 现在 就 将 它 设置 为 false， 以 免 后 面 态 记 修改 它 。 然 后 创 
建 临 时 文件 work_file 并 初始 化 客户 消息 结构 。 


(3) 接 下 来 是 三 重 条 件 判 晰 ， 它 将 调用 pipe_imp.c 文 件 中 的 函 
数 。 如 有 果 消 息 被 成 功 发 送 给 服务 锅 ， 窜 户 束 开始 等 竺 服务 硕 的 啊 应 。 
成 功 读 取 了 服务 需 返 回 的 啊 应 后 ， 就 将 搜索 的 匹配 结果 保存 到 客户 的 
临时 文件 work_file 中 ， 同 时 增加 匹配 计数 右 entries_matching 的 值 。 


(4) 接 下 来 的 测试 检查 搜索 是 否 找到 匹配 数据 。 然 后 通过 fseek 
调用 设置 work _file 的 下 一 个 数据 写 入 位 置 。 


(5) 如 果 这 不 是 本 次 搜索 操作 中 第 一 次 调用 搜索 函数 ， 代 码 将 检 
征 否 还 有 其 他 匹配 。 最 后 ， 把 下 一 个 匹配 数据 项 读 到 ret_val 结 构 
^ 此 前 的 检查 用 来 确保 还 有 匹配 项 存在 。 


13.7.4 O |server.c 


"tt [a] Pine 1 Hid app uicEEFERJESLI, ARS abit SAE 
序 用 来 控制 cd_dbm.c (在 以 前 的 版 本 中 名 字 是 cd_access.c) 。 下 面 是 
服务 器 的 main 范 数 代码 。 
(1) 首先 声明 一 些 全 局 变量 、process_command 范 数 的 原型 和 一 
Pe ee _signals 函 数 。 


(2) 下 面 是 main 函 数 的 代码 。 在 检查 完 信 和 号 捕获 例 程 可 以 正常 工 
作 后 ， 程 序 检查 用 户 是 否 在 命令 行 上 输入 了 -i 选项 。 如 果 有 ， 它 就 创 
建 一 个 新 数据 库 。 如 果 调 用 cd_dbm.c 中 的 database_initialize 函 数 失 败 ， 
承 给 出 一 条 钳 误 消息 。 如 果 一 切 正 稼 则 服务 恬 开始 运 行 ， 来 目 客户 的 
fee 发 往 process_command 函 数 ， 我 们 后 面 将 会 讲 到 这 个 函 
数 o 


t Biniint ar 


(3) 所 有 客户 的 消息 都 将 被 发 往 process_command 函 数 ， 在 那里 
它们 被 放 入 一 个 case 语 句 ， 进 而 调用 cd_dbm.c 中 相应 的 函数 。 


static void process cozmand|const measage db t comm) 
{ 


massage ib t resp; 
int first rime = i; 


resp w comm; /* copy command back, then change resp as required */ 


if (tatart resp to clientiresp]] [ 
fprintf(stderr, *Server Warning:-\ 
atart_resp_to_cliens Wd failed\n‘, resp.client_pid); 
feturn: 
) 


reap. reeponse = r wuccesa; 
memsetiresp.error text, 'i0', giseof(resp.error text]); 
save errno © 0: 


mwitch[resp.request| | 

Case s create new database: 
if (!database initialise|]]) resp.renponse = r failure: 
break; 

case s get cóc entry: 
resp.cdc entry data = 

get oic entry|comm.cdc entry data. catalog): 

break; 


cane s_get_cdt_entry: 


regp.cdt entry data « 
get cdt, entry(comm.cdt entry data, catalog. 
comm.odt entry data.track nol: 
break; 
case m add odc antry: 
if |ladd cdc entry(comm.cdc entry data)] resp.rezponse = 
t failure; 
break: 


case s add cdt entry: 
if lladd cdt entry(ccem.cde, entry data] } resp.response + 
t_tailure: 
break; 
Case « del cde entry: 
if (!dal các antry|ccem.cdc entry data.catslog!) resp.response 
* s failure; 
break; 2 


case z del cdt entey: 
Af lidel cdt mntrylcomm.cdt entry data.catalog, 
comm.cdt entry data.track no]| resp.response s r failure; 


Afirst tine]! 
if (remp.cde entry data,catalog[0] i= 0) { 
Feep.resposse = r WUüCCeNS; 


ASMA BWR AS, RRA, ERPS nit 
程 之 间 传 递 数 据 时 各 种 事件 发 生 的 先后 顺序 。 图 13-9 显 示 客 户 和 服务 
絮 进 程 在 各 目 启 动 之 后 ， 双 方 在 处 理 命令 和 啊 应 时 的 循环 情况 。 

在 具体 实现 中 ， 情 况 要 更 复杂 一 些 。 因 为 在 搜索 请 求 中 ， 客 户 回 
服务 套 传 递 一 条 命令 ， 然 后 等 竺 从 服务 右 中 接收 一 个 或 多 个 啊 应 。 这 
忠 使 得 情况 更 复 洒 了 ， 但 主要 是 在 客户 是 。 


服务 器 |/ | 
返回 结果 


13.7.5 ”管道 


下 面 是 实现 管道 功能 的 pipe_imp.c 文 件 ， 它 同时 包含 客户 端 和 服务 
器 端的 画 数 。 

在 第 10 章 中 我 们 见 到 过 DEBUG_TRACE 标 志 ， 我 们 可 以 通过 定义 
ei ee ee mee al 
行 顺序 。 


1. 管 道 实现 的 开始 部 分 


(1) 首先 是 其 nclude 语 句 : 


#include "cd data.h" 
finclude “cliserv.h" 


(2) 我 们 还 定义 了 一 些 在 此 文件 里 的 函数 中 会 用 到 的 值 : 


2. H5 25 Ss? ER X 


接 下 来 ， 我 们 来 看 服务 器 端的 函数 。 第 一 部 分 显示 打开 、 关 闭 命 
名 管道 和 读 取 来 自 客户 的 消息 的 函数 。 第 二 部 分 显示 用 于 打开 、 发 送 
和 关闭 客户 管道 的 代码 ， 客 户 管道 名 基于 客户 包含 在 其 请 求 消息 中 的 
进程 ID 来 确定 。 

“服务 器 函数 

(1) server_starting 例 程 先 为 服务 器 创建 一 个 它 将 从 中 读 取 命令 

的 命名 管道 ， 然 后 以 只 读 方 式 打 开 这 个 管道 。 这 个 open 调 用 将 阻塞 到 
有 客户 以 写 方式 打开 这 个 管道 为 止 。 使 用 阻塞 模式 可 以 使 服务 器 在 等 
待 发 送 过 来 的 命令 时 对 管道 执行 阻塞 式 读 取 。 


(2) 当 服 务 器 结束 时 ， 它 删除 命名 管道 ， 这 样 客户 就 可 以 检测 出 
没有 服务 闫 在 运行 : 


(3) 下 面 给 出 的 read_request_ from_dlient 函 数 会 阻塞 在 对 服务 器 
管道 的 读 操作 上 ， 直 到 有 客户 癌 其 中 写 入 一 条 消息 为 止 : 


.req 


nt read bytes; 


#if DEBUG TRACE 


printf("$d :- read request, from client()Mn", getpid()); 
fendif 
if (server_fd ! 1] 

read bytes = read(server fd, rec ptr, sizeof(*rec ptr)); 


) 


return (return_code); 


} 


(4) 如 采 出 现 没有 任何 客户 以 写 方式 打开 这 个 管道 的 特殊 情况 ， 
read 调 用 将 返回 9。 也 就 是 说 ， 它 检测 到 一 个 EOF， 此 时 服务 絮 会 关闭 
管道 并 重新 打开 它 ， 这 样 服务 此 束 可 以 阻塞 到 有 客户 打开 这 个 管道 为 
止 。 这 与 服务 絮 第 一 次 启动 时 的 情况 完全 一 样 ， 等 于 我 们 重新 初始 化 
了 服务 硕 。 把 下 面 这 些 代码 插 到 上 面 的 函数 中 去 : 


Ar 1 
fprintt (stderr Server error Fir open failedin* 


Rire MEE, CHARAN PARA BRAS ^ DNOASRTAED 
FAS TRIES EP ERDA, FT EAR AS ees e BE Hd A LEE XL P [1 B 
PF AGAMA * T POC PT MICI zm FR BR, IT RS s A 
在 需要 发 送 数据 时 才 会 以 写 方式 打开 一 个 客户 管道 。 

我 们 将 打开 、 写 入 和 关闭 客 户 管道 分 离 为 3 个 独立 的 函数 。 这 是 为 
了 适应 数据 库 搜索 返回 多 个 搜索 结果 的 情况 ， 这 样 我 们 可 以 只 打开 管 
道 一 次 ， 写 入 多 个 啊 应 ， 然 后 再 关闭 它 。 

“探测 管道 


(1) 首先 打开 客户 管道 : 


int start resp 


printf!"tÀ 
fendif 


(2) 消息 都 是 通过 调用 这 个 函数 发 送出 去 的 。 我 们 后 面 就 会 看 到 
WY DAY PBC LP s ER o 


(3) 最 后 ， 关 闭 客户 管道 : 


3. F3 ER B 


pipe imp. XF F 5j HR 25 gsm KR th ee e PO NAL, DR I ABS 
% jsend, mess, to server A, ETERS ARS ms m AVR AAD o 

«A PERSE 
m (1) TERES AS as n VIE. client starting KR WALA F^ 9r 
EIE: 


) 


(2) Client_ending 函 数 的 作用 是 关闭 文件 描述 符 并 删除 目前 多 余 
的 命名 管道 : 


JE. 
pt 
3 ait 
if [ci wri 1 te -1) (void) 
if (cl td | j 
i [ger fd 
(void) kic n 


(3) send_mess_to_server 范 数 的 作用 是 通过 服务 器 管道 传递 请 


` 
») . 
int gend mess to server(message db t zegs to send 
' EBUG TRA 
rin 1 
ta 
ite by | = wri rver_fa r t pend, si: ind! } 
if (write bytes sizeofí[ímess. to send zetuzn(0) 


ret 


PCN BW TRO AB AAR P EMO IL, A T BEUEREERAS T iR E 
SER, EPUM ROS se UI RET LE HE T 3 ERI o 
“取得 服务 器 返回 的 结果 
(1) 这 个 客户 函数 开始 监听 服务 器 的 啊 应 。 它 移 以 只 读 方 式 打开 
一 个 客户 管道 ， 然 后 义 以 只 写 方式 重新 打开 这 个 管道 。 我 们 将 在 本 市 
的 稍 后 部 分 解释 这 样 做 的 原因 。 


nri E pen ent pipe e ILY) 

llent f = -l 

client_write_fd Fr an WRO 
client 
) e 

“iant fd 


(2) 下 面 是 具体 负责 从 服务 器 读 取 响应 的 read 调 用 ， 它 将 取 回 匹 
配 的 数据 库 条 目 : 


v ib t *rec p 
I read bytes 
int return. 
$ g ~ a 
- pt 
ent 
read bytes » readiclient fd, rec ptr, P 
ead bytes == giszeof[(*rec ptr)) return code = 2 
retum (return, code] ; 


(3) 最 后 这 个 客户 函数 标记 服务 器 啊 应 的 结束 : 


Sif DEBUG TRACZ 
printf("Ad := end resp from server n", getpidl) 
tendif 


empty in the pipe implementation * 


在 start_resp_from_server 函 数 中 第 二 个 以 写 方式 打开 客户 管道 的 调 
用 是 : 


client write fd = open(client, pipe name, O_WRONLY) ; 


它 用 来 防止 一 个 竞争 条 件 的 出 现 ， 这 个 竞争 条 件 会 在 服务 器 需要 响应 
来 目 同一 个 客户 的 快速 、 连 续 的 多 个 请 求 时 发 生 。 
" 为 了 将 这 个 问题 解释 得 更 清楚 ， 我 们 来 看 看 这 个 事件 发 生 的 过 


(1) 客户 发 送 一 个 请 求 给 服务 器 。 


(2) 服务 器 读 取 请 求 ， 打 开 客 户 管道 并 发 回 啊 应 ， 但 在 关闭 客户 
管道 之 前 被 挂 起 。 
(3) 客户 以 读 方 式 打开 有 目 己 的 管道 ， 读 取 第 一 个 啊 应 并 关闭 管 


(4) 客户 然后 发 送 一 个 新 命令 并 再 次 以 读 方式 打开 客户 管道 。 
(5) 此 时 服务 器 恢复 运行 ， 关 闭 它 那 端的 客户 管道 。 
精 薰 的 是 ， 此 时 客户 正 演 试 从 这 个 管道 读 取 数 据 ， 等 待 目 己 下 一 
个 请 求 的 啊 应 ， 但 因为 已 无 进程 以 写 方式 打开 这 个 客户 管道 ， 所 以 
read 调 用 将 返回 0 字 广 。 
通过 人 允许 客户 以 读 写 两 种 方式 打开 它 目 己 的 管道 ， 就 消除 了 反复 
重新 打开 这 个 管道 的 需要 ， 从 而 避免 了 竞争 条 件 的 产生 。 因 为 客户 永 
远 也 不 会 癌 这 个 管道 写 数据 ， 所 以 不 会 有 读 到 错误 数据 的 危险 o 


13.7.6 ”对 CD 六 用 程序 的 总 结 


现在 ， 我 们 已 经 把 CD 数据 库 应 用 程序 分 为 客户 和 服务 器 两 部 分 
了 ， 这 使 我 们 可 以 对 用 户 界 面 和 故 层 的 数据 库 技术 分 别 进行 独立 的 开 
发 。 我 们 可 以 看 到 ， 一 个 精心 定义 的 数据 库 接口 可 以 让 应 用 程序 的 每 
个 主要 部 分 充分 地 使 用 计算 机 资源 。 进 一 步 地 ， 我 们 还 可 以 把 管道 实 
现 方 案 改 进 为 网 络 实现 方案 ， 并 使 用 一 个 专用 的 数据 库 服务 器 。 我 们 
将 在 第 15 划 学 习 更 多 的 网 络 编程 。 


13.8 ”人 小结 


在 本 章 中 ， 我 们 介绍 了 如 何 使 用 管道 在 进程 之 间 传 递 数据 。 首 
先 ， 介 绍 了 通过 popen 或 pipe 调 用 创建 的 未 命名 管道 ， 并 且 讨 论 了 如 何 
使 用 管道 和 dup 调 用 把 数据 从 一 个 程序 传递 到 另 一 个 程序 的 标准 输入 。 
接 下 来 ， 我 们 介绍 了 命名 管道 以 及 如 何在 不 相关 的 程序 之 间 传 递 数 
据 。 最 后 ， 实 现 了 一 个 简单 的 客户 /服务 器 例子 ，FIFO 的 使 用 不 仅 回 我 
们 提供 了 进程 间 的 同步 ， 还 提供 了 双 辣 的 数据 流 。 


-由 这 里 所 指 的 情况 是 当 FIFO 被 设置 为 非 阻 塞 模式 时 。 一 一 译 者 注 


Erat, 我 们 将 讨论 一 组 进程 间 通 信 的 机 制 ， 它 们 最 初 由 
AT&T System V2 版 本 的 UNIX 引 入 。 由 于 这 些 机 制 都 出 现在 同一 个 版 
本 中 并 且 有 着 相似 的 编程 接口 ， 所 以 它们 又 第 被 称 为 PC (Inter- 
Process Communication ， 进 程 间 通信 ) 机 制 ， 或 被 更 常见 的 称 为 
System V IPC。 正 如 我 们 所 看 到 的 ， 它 们 并 不 是 进程 间 通 信 的 唯一 方 
法 ， 但 人 们 通常 把 这 些 特定 的 机 制 称 为 System V IPC ° 

在 本 章 中 ， 我 们 将 介绍 以 下 几 方面 的 内 容 。 

O 信号 量 : 用 于 管理 对 资源 的 访问 。 

OD ZNP: 用 于 在 程序 之 间 高 效 地 共享 数据 。 

O WEDS: 在 程序 之 间 传 递 数 据 的 一 种 简单 方法 。 


14.1 信号 量 


当 我 们 编写 的 程序 使 用 了 线程 时 ， 不 管 它 是 运行 在 多 用 户 系统 
上 、 多 进程 系统 上 ， 还 十 运行 在 多 用 户 多 进程 系统 上 ， 我 们 通常 会 发 
现 ， 程 序 中 存在 着 一 部 分 临界 代码 ， 我 们 需要 确保 只 有 一 个 进程 (或 
一 个 执行 线程 ) 可 以 进入 这 个 临界 代码 并 拥有 对 资源 独占 式 的 访问 


权 

信和 号 量 有 着 复杂 的 编程 接口 ， 但 幸运 的 是 ， 我 们 可 以 很 轻松 地 为 
目 己 提 供 一 个 更 简单 的 接口 ， 它 足够 应 付 大 多 数 信号 量 编程 的 问题 。 

第 7 章 的 第 一 个 示例 程序 用 dbm 来 访问 数据 库 。 如 果 有 多 个 程序 试 
图 在 同一 时 间 更 新 这 个 数据 库 ， 数 据 束 可 能 会 遭 到 破坏 。 两 个 不 同 的 
程序 有 要 求 不 同 的 用 户 回 数据 库 输 入 数据 ， 这 本 吴 并 没有 错 ， 问 题 只 可 
能 出 现在 对 数据 库 进行 更 新 的 那 部 分 代码 上 。 这 部 分 真正 执行 数据 更 
新 的 代码 需要 独占 式 地 执行 ， 它 们 被 称 为 临界 区 域 。 它 们 通常 只 在 一 
个 大 型 程序 中 占据 一 小 段 的 代码 。 

为 了 防止 出 现 因 多 个 程序 同时 访问 一 个 共享 资源 而 引发 的 问题 ， 
我 们 需要 有 一 种 方法 ， 它 可 以 通过 生成 并 使 用 令 牌 来 授权 ， 在 任 一 时 
刻 只 能 有 一 个 执行 线程 访问 代码 的 临界 区 域 。 在 第 12 章 我 们 人 简单 介绍 
了 一 些 线 程 特定 的 方法 ， 我 们 可 以 在 使 用 线程 的 程序 中 通过 互 不 量 或 
信号 量 来 控制 对 临界 区 域 的 访问 。 在 本 章 中 ， 我 们 又 回 到 信和 号 量 的 主 
题 上 ， 但 将 对 它们 如 何在 不 同 的 进程 之 间 使 用 做 更 具 壮 衣 意 义 地 介 


绍 。 


我 们 在 本 章 介绍 的 信号 量 函 数 比 在 第 12 章 看 到 的 用 于 线程 的 
言 写 量 函 数 要 更 通用 ， 所 以 请 不 要 把 这 两 者 混淆 。 


要 想 编写 通用 的 代码 ， 以 确保 程序 对 某 个 特定 的 资源 具有 独占 式 
的 访问 权 古 非常 困难 的 。 虽 然 有 一 个 名 为 Dekker 算 法 的 解决 方法 ， 但 
这 个 滤 法 依赖 于 “ 忙 等 得 ”或 “ 目 旋 锁 "。 也 就 是 说 ， 一 个 进程 要 持续 不 
断 地 运行 以 等 待 某 个 内 存 位 置 被 改变 。 在 像 Linux 这 样 的 多 任务 环境 
中 ， 人 们 并 不 愿意 使 用 这 种 浪费 CPU 资源 的 处 理 方 法 。 但 如 果 硬 件 文 
持 独 占 式 访问 〈 一 般 是 通过 特定 的 CPU 指令 的 形式 ) ， 那 么 情况 就 变 
得 简单 多 了 。 一 个 硬件 支持 的 例子 束 是 ， 用 一 条 指令 以 原子 方式 访问 
并 增加 寄存 器 的 值 ， 在 这 个 读 取 /增加 / 写 入 操作 执行 的 过 程 中 不 会 
其 他 指令 (甚至 一 个 中 断 ) AE 


我 们 前 面 见 过 的 一 种 可 能 的 解决 方法 是 ， 使 用 市 0O_EXCL 标 志 的 
open 了 芳 数 来 创建 锁 文 件 ， 它 提供 了 原子 化 的 文件 创建 方法 。 它 允许 一 
个 进程 通过 获取 一 个 令 牌 〈“ 即 新 创建 的 文件 ) 来 取得 成 功 。 这 个 方法 
比较 适合 于 处 理 人 简单 的 问题 ， 但 对 于 更 复杂 的 例子 ， 它 就 显得 比较 灯 
乱 且 缺乏 效率 。 

何 兰 计算 机 科学 家 Edsger Dijkstra 提 出 的 信号 量 概念 是 在 并 发 编程 
领域 迈 出 的 重要 一 步 。 正 如 我 们 在 第 12 章 所 讨论 的 ， 信 号 量 是 一 个 特 
殊 的 变量 ， 它 只 取 正 整数 值 ， 并 且 程 序 对 其 访问 都 是 原子 操作 。 在 本 
章 中 ， 我 们 将 对 这 个 较 早 的 简化 定义 做 进一步 的 解释 。 我 们 将 详细 说 
明 信 和 号 量 是 如 何 工 作 的 ， 如 何在 不 同 进程 之 间 使 用 具备 更 通用 功能 的 
函数 ， 而 不 是 像 我 们 在 第 12 划 中 看 到 的 那个 多 线程 程序 的 特例 。 

言 号 量 的 一 个 更 正式 的 定义 是 : 它 是 一 个 特殊 变量 ， 只 人 允许 对 它 
进行 等 待 《wait) 和 发 送信 号 (signal) 这 两 种 操作 。 因 为 在 Linux 编 程 
中 , “等待 " 和 “发 送信 号 ”都 已 具有 特殊 的 含义 ， 所 以 我 们 将 用 原先 定 
义 的 符号 来 表示 这 两 种 操作 o 

O P 〈 信 和 号 量变 量 ) : 用 于 等 待 。 

Hu V (信号 量变 量 ) : 用 于 发 送信 和 号。 

这 两 个 字母 分 别 来 自 于 荷兰 语 单 词 passeren (传递 ， 就 好 像 位 于 进 
入 临界 区 域 之 前 的 检查 点 ) 和 vrijgeven (给 予 或 释放 ， 就 好 像 放弃 对 
临界 区 域 的 控制 权 ) 。 在 与 信号 量 关 联 的 内 容 中 ， 你 可 能 还 会 看 到 术 
语 “ 开 ” (up) MK” (down) ， 它 们 取 自 开 、 关 信号 标志 的 用 法 。 


14.1.1 量 的 定 》 


最 简单 的 信号 量 是 只 能 取 值 0 和 1 的 变量 ， 即 二 进 制 信号 量 。 这 也 
古 信 号 量 最 常见 的 一 种 形式 。 可 以 取 多 个 正 整 数值 的 信号 量 被 称 为 通 
用 信和 号 量 。 在 本 章 后 面 的 内 容 中 ， 我 们 将 集中 讨论 二 进 制 信号 量 。 

PV 操 作 的 定义 非常 简单 。 假 设 有 一 个 信号 量变 量 SV， 则 这 两 个 
操作 的 定义 如 表 14-1 所 示 。 
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还 可 以 这 样 看 信号 量 : 当 临 界 区 域 可 用 时 ， 信 号 量变 量 SV 的 值 是 
true， 然 后 P (sv) 操作 将 它 减 1 使 它 变 为 false 以 表示 临界 区 域 正在 被 使 
Al; 当 进 程 离开 临界 区 域 时 ， 使 用 V_ (sv) 操作 将 它 加 1， 使 临界 区 域 
再 次 变 为 可 用 。 注 意 ， 只 用 一 个 普通 变量 进行 类 似 的 加 减法 是 不 行 
的 ， 因 为 在 C、C++、C# 或 几乎 任何 一 个 传统 的 编程 语言 中 ， 都 没有 


一 个 原子 操作 可 以 满足 检测 变量 是 否 为 tue， 如 采 是 再 将 该 变量 设置 
为 false 的 需要 。 这 也 是 信号 量 操 作 如 此 特殊 的 原因 。 


14.1.2 一 个 理论 性 也 


我 们 用 一 个 简单 的 理论 性 的 例子 来 说 明 其 工作 原理 。 假 设 有 两 个 
进程 proc1 和 proc2 ， 这 两 个 进程 都 需要 在 其 执行 过 程 中 的 某 一 时 刻 对 
一 个 数据 库 进 行 独 占 式 的 访问 。 我 们 定义 一 个 二 进 制 信号 量 sv， 该 变 
量 的 初始 值 为 1， 两 个 进程 都 可 以 访问 它 。 要 想 对 代码 中 的 临界 区 域 进 
行 访 问 ， 这 两 个 进程 都 需要 执行 相同 的 处 理 步 又， 事实 上 ， 这 两 个 进 
程 可 以 只 是 同一 个 程序 的 两 个 不 同 执行 实例 。 

两 个 进程 共享 信号 量变 量 sv。 一 旦 其 中 一 个 进程 执行 了 P (sv) PR 
作 ， 它 将 得 到 信号 量 ， 并 可 以 进入 临界 区 域 。 而 第 二 个 进程 将 被 阻止 
进入 临界 区 域 ， 因 为 当 它 试图 执行 P (sv) 操作 时 ， 它 会 被 挂 起 以 等 待 
第 一 个 进程 离开 临界 区 域 并 执行 V (sv) 操作 释放 信和 号 量 。 

需要 的 伪 代 码 对 两 个 进程 都 是 相同 的 ， 如 下 所 示 : 


semapnore SV = 1; 


loop forever { 
P(sv); 
critical code section; 
V(sv); 
noncritical code section; 
) 
这 段 代 码 相 当 简 单 ， 这 是 因为 PV 操 作 的 功能 非常 强大 。 图 14-1 显 
示 了 PV 操作 是 如 何 把 守 代 码 中 的 临界 区 域 的 。 


进程 A 的 执行 线程 进程 B 的 执行 线程 


信号 量 的 P 操 作 


进程 B 的 非 
临界 区 域 部 分 


进程 A 的 非 
临界 区 域 部 分 


: 任 一 时 刻 只 
ee 允许 一 个 执 


行 线程 进入 
临界 区 域 


信号 量 的 V 操 作 


14.1.3 LinuxH E 


现在 ， 我 们 已 了 解 了 信和 号 量 的 人 台 义 及 其 工作 原理 ， 接 下 来 我 们 来 
看 看 ， 在 Linux 系 统 中 是 如 何 实现 这 些 功 能 的 。Linux 系 统 中 的 信和 号 量 
接口 经 过 了 精心 设计 ， 它 提供 了 比 通 第 所 需 更 多 的 机 制 。 所 有 的 Linux 
aT RNR ee A Ae SET PRE, TM Ae RED 
二 进 制 信号 量 。 乍 看 起 来 ， 这 好 像 把 事情 弄 得 更 复杂 了 ， 但 在 一 个 进 
程 需要 锁定 多 个 资源 的 复杂 情况 中 ， 这 种 能 够 对 一 组 信号 量 进行 操作 
的 能 力 是 一 个 巨大 的 优势 。 在 本 章 中 ， 我 们 将 集中 讨论 单个 信号 量 的 
使 用 ， 因 为 在 绝 大 多 数 情况 下 ， 使 用 它 束 足够 了 。 

HC ENA RE SCIT P Br: 


#include «sys/sem.h» 


int semctl(int sem id, int sem num, int command, ...); 
int semget(key t key, int num sems, int sem flags); 
int semop(int sem id, struct sembuf *sem ops, size t num sem ops); 


3k X ff sys/sem.h 28 AY 4 BM T A WAIT k XC IF sys/types.h 和 
sys/ipc.h。 一 般 情况 下 ， 它 们 都 会 被 sys/sem.h 目 动 包 含 ， 因 此 不 需 
要 为 它们 明确 添加 相应 的 #include 语 句 。 

在 了 逐个 介绍 这 些 函 数 时 ， 请 记 住 ， 这 些 函 数 都 是 用 来 对 成 组 
的 信和 号 量 值 进行 操作 的 。 这 使 得 ， 对 它们 的 操作 要 比 单个 信和 号 量 
所 需要 的 操作 复杂 得 多 。 


参数 key 的 作用 很 像 一 个 文件 名 ， 它 代表 程序 可 能 要 使 用 的 某 个 资 
源 ， 如 有 果 多 个 程序 使 用 相同 的 key 值 ， 它 将 负责 协调 工作 。 与 此 类 似 ， 
由 semget 函 数 返 回 的 并 用 在 其 他 共 吾 内 存 函 数 中 的 标识 符 也 与 fopen 返 
回 的 FILE* 文 件 流 很 相似 ， 进 程 需 要 通过 它 来 访问 共 至 文件 。 此 外 ， 
类 似 于 文件 的 使 用 情况 ， 不 同 的 进程 可 以 用 不 同 的 信号 量 标识 符 来 指 
回 同一 个 信号 量 。 对 于 我 们 将 在 本 章 讨 论 的 所 有 IPC 机 制 来 说 ， 这 种 
一 个 键 加 上 一 个 标识 符 的 用 法 是 很 常见 的 ， 尽 管 每 个 机 制 都 使 用 独立 
的 键 和 标识 符 。 

1. semget HAL 
" semget EK AHF za 8 8 — Tore Ss BRS 1 CU SB 
E: 


int semaet(kev t kev. int num sems, int sem [laqs); 

第 一 个 参数 key 是 整数 值 ， 不 相关 的 进程 可 以 通过 它 访问 同一 个 信 
号 量 。 程 序 对 所 有 信号 量 的 访问 都 是 间接 的 ， 它 先 提 供 一 个 键 ， 再 由 
系统 生成 一 个 相应 的 信号 量 标识 符 。 只 有 semget 函 数 才 直接 使 用 信号 
ib, FV SORA fe HRCA eC Hl semget BM 008 [ETE f 57 B 
VAT? 

有 一 个 特殊 的 信和 号 量 键 值 IPC_PRIVATE， 它 的 作用 是 创建 一 个 只 
有 创建 者 进程 才 可 以 访问 的 信号 量 ， 但 这 个 键 值 很 少 有 实际 的 用 途 。 
在 创建 新 的 信号 量 时 ， 你 需要 给 键 提供 一 个 唯一 的 非 零 整数 。 

num_sems 人 参数 指定 需要 的 信号 量 数目 。 它 几乎 总 是 取 值 为 1。 

sem_flags 参 数 是 一 组 标志 ， 它 与 open 函 数 的 标志 非常 相似 。 它 低 
端的 9 个 比特 是 该 信号 量 的 权限 ， 其 作用 类 似 于 文件 的 访问 权限 。 此 
外 ， 它 们 还 可 以 和 值 IPC_CREAT 做 按 位 或 操作 ， 来 创建 一 个 新 信号 
量 。 即 使 在 设置 了 IPC_CREAT 标 志 后 给 出 的 键 是 一 个 已 有 信号 量 的 
键 ， 也 不 会 产生 错误 。 如 果 函 数 用 不 到 IPC_CREAT 标 志 ， 该 标志 了 吏 会 
被 悄悄 地 忽略 掉 。 我 们 可 以 通过 联合 使 用 标志 IPC_CREAT 和 
IPC_EXCL 来 确保 创建 出 的 是 一 个 新 的 、 唯 一 的 信号 量 。 如 果 该 信号 
量 已 存在 ， 它 将 返回 一 个 错误 。 

semget 芳 数 在 成 功 时 返回 一 个 正 数 (GERE) 值 ， 它 就 是 其 他 信和 号 
量 画 数 将 用 到 的 信和 号 量 标识 符 。 如 果 失 败 ， 则 返回 -1。 

2. semop HAL 


semopH WHT MRS BANE, CAVE SUI P Brzn: 


int aammnníint gem id. atruct namur "sem ONS. size t num sem ODS!: 
58 — T Z:3Xsem idzé Hsemgetik& HWE S E ERAT e B TAA 
sem opszéiHIE —T2aM BANS ET, BERATED EE A BLT 


LB. 


struct sembuf { 
short sem_num; 
short sem_op; 
short sem flg; 


) 

第 一 个 成 员 sem_num 是 信号 量 编号 ， 除 非 你 需要 使 用 一 组 信号 
量 ， 否 则 它 的 取 值 一 般 为 0。sem_op 成 员 的 值 是 信号 量 在 一 次 操作 中 
需要 改变 的 数值 〈 你 可 以 用 一 个 非 1 的 数值 来 改变 信号 量 的 值 ) 。 通 常 
只 会 用 到 两 个 值 ， 一 个 是 -1， 也 了 豆 是 P 操 作 ， 它 等 待 信号 量变 为 可 用 ; 
一 个 是 +1， 也 就 是 V 操 作 ， 它 发 送信 号 表示 信和 号 量 现 在 已 可 用 。 

最 后 一 个 成 员 sem_flg 通 常 被 设置 为 SEM_UNDO。 它 将 使 得 操作 
系统 跟踪 当前 进程 对 这 个 信号 量 的 修改 情况 ， 如 果 这 个 进程 在 没有 释 
放 该 信号 量 的 情况 下 终止 ， 操 作 系 统 将 自动 释放 该 进程 持 有 的 信和 号 
量 。 除 非 你 对 信和 号 量 的 行为 有 特殊 的 要 求 ， 否 则 应 该 养 成 设置 sem_flg 
为 SEM_UNDO 的 好 习惯 。 如 果 决 定 使 用 一 个 非 SEM_UNDO 的 值 ， 那 
就 一 定 要 注意 保持 设置 的 一 致 性 ， 否 则 你 很 可 能 会 搞 不 清楚 内 核 是 否 
会 在 进程 退出 时 清理 信号 量 。 

semop 调 用 的 一 切 动作 都 是 一 次 性 完成 的 ， 这 是 为 了 避免 出 现 因 
使 用 多 个 信号 量 而 可 能 发 生 的 竞争 现象 。semop 的 处 理 细节 可 以 在 手 
册页 中 找到 。 

3. semctl ERA 

semctliK Žž H KE Beta n fei o See, CARE CAU P Arm: 


int semctl(int sem id, int sem num, int command, ...); 


第 一 个 参数 sem_id 是 由 semget 返 回 的 信号 量 标识 符 。sem_num 参 
数 是 信号 量 编号 ， 当 需要 用 到 成 组 的 信号 量 时 ， 束 要 用 到 这 个 参数 ， 
它 一 般 取 值 为 0， 表 示 这 是 第 一 个 也 是 唯一 的 一 个 信号 量 。command 参 
数 是 将 要 来 取 的 动作 。 如 果 还 有 第 四 个 参数 ， 它 将 会 是 一 个 union 
semun 结 构 ， 根 据 X/OPEN 规 苑 的 定义 ， 它 至 少 包 含 以 下 几 个 成 员 : 


union semun { 
int val; 
struct semid ds *buf; 
unsigned short *array; 


} 


虽然 X/Open 规范 中 指出 ，semun 联 合 结构 必须 由 程序 员 自 己 定 

但 大 多 数 Linux 版 本 会 在 某 个 头 文件 (一 般 是 sem.h) 中 给 出 该 结 
， 需要 目 己 来 定义 该 结构 ， 请 查阅 semctl 的 
TA, 看 手册 中 是 给 出 了 定义 。 如 果 有 ， 我 们 建议 使 用 手册 中 

给 出 的 定义 ， i teasers 人 台 出 的 定义 不 一 致 也 应 该 如 此 。 

semctl A EH HI command HAA WEES RIE 但 只 有 下 
面 介 绍 的 两 个 值 最 常用 。 semctl ER SSA zE 整 细节 请 查阅 它 的 手册 页 o 

O SETVAL: 用 来 把 信号 量 初始 化 为 一 个 已 知 的 值 。 这 个 值 通过 

union semun 中 的 val 成 员 设置 。 其 作用 是 在 信号 量 第 一 次 使 用 之 前 

对 它 进 行 设 置 。 

DPC_RMID: 用 于 删除 一 个 己 经 无 需 继 续 卖 使 用 的 信号 量 标识 


符 
semctl 男 数 将 根据 command 参 数 的 不 同 而 返回 不 同 的 值 。 对 于 
SETVAL 和 IPC_RMID， 成 功 时 返回 90， 失败 时 返回 -1 e 


14.1.4 HER 


从 上 一 太 的 介绍 可 以 看 出 ， 信 号 量 的 操作 相当 复杂 。 这 可 不 是 一 
MAB, 因为 编写 包含 临界 区 域 的 多 进程 或 多 线程 程序 本 身 就 是 一 
件 非常 困难 的 事情 ， 再 加 上 一 个 如 此 复杂 的 编程 接口 ， 这 就 更 增添 了 
编程 者 的 精神 人 负担 。 

装运 的 是 ， 六 部 分 需要 使 用 信号 量 米 解决 的 问题 只 需 使 用 一 个 最 
简单 的 二 进 制 信号 量 即 可 。 在 下 面 的 例子 中 ， 我 们 将 用 完整 的 编程 接 
口 为 二 进 制 信号 量 创建 一 个 简单 得 多 的 PV 类 型 接口 ， 然 后 用 这 个 非常 
简单 的 接口 来 演示 信号 量 古 如 何 工作 的 。 

我 们 将 用 程序 sem1.c 来 试验 信号 量 ， 该 程序 可 以 被 多 次 调用 。 我 
们 通过 一 个 可 迁 的 参数 来 指定 程序 是 人 负责 创建 信号 量 还 是 负责 删除 信 
T 


e 


我 们 用 两 个 不 同 字 符 的 输出 来 表示 进入 和 离开 临界 区 域 。 如 采 程 
序 司 动 时 市 有 一 个 参数 ， 它 将 在 进入 和 退出 临界 区 域 时 打印 字符 x; 而 
程序 的 其 他 运行 实例 将 在 进入 和 退出 临界 区 域 时 打印 字符 o。 因 为 在 任 
一 给 定时 刻 ， 只 能 有 一 个 进程 可 以 进入 临界 区 域 ， 所 以 字符 x 和 o 应 该 
征 成 对 出 现 的 。 


x 验 信号 量 

(1) 在 包含 了 必需 的 系统 头 文 件 之 后 ， 我 们 包含 了 头 文件 
semun.h。 如 果 系 统 头 文件 sys/sem.h 没 有 定义 X/OPEN 规 范 所 需 的 联合 
semun， 这 个 头 文件 包含 了 对 它 的 定义 。 然 后 是 函数 原型 的 声明 和 全 
局 变量 的 定义 ， 接 着 束 到 了 main 函 数 的 定义 。 我 们 调用 semget 来 创建 
一 个 信号 量 ， 该 函数 将 返回 一 个 信号 量 标识 符 。 如 采 程 序 是 第 一 个 被 
调用 的 (也 就 是 说 它 在 被 调用 时 市 有 一 个 参数 ， 使 得 argc>1) ， 就 调 
用 set_semvalue 初 始 化 信号 量 并 将 op_char 设 置 为 x: 


Binclude <stdlib.h> 
FRinciude <stdio.h> 


(2) 接 下 来 是 一 个 循环 ， 它 进入 和 离开 临界 区 域 10 次 。 在 每 次 循 
环 的 开始 ， 自 先 调用 semaphore_p 了 芳 数 ， 它 在 程序 将 进入 临界 区 域 时 设 
置信 号 量 以 等 待 进入: 


printi|"!* 


(3) 在 临 AKRZE, A semaphore. v 来 将 信号 量 设置 为 可 
用 ， 然 后 等 外 er UE i o ea eas 


(4) 函数 set_. mt semctl 调 用 的 command 参 数 设置 为 
SETVALAKBURR pei 。 在 使 用 信和 号 量 之 前 必须 要 这 样 做 : 


(5) ERaXdel_semvalueMI72 5 EMA ER SU LS — ib , RA 
通 Esser ài P ommand NIC _RMID 来 删除 信号 量 ID: 


tderz Failed to delet saphore\n*); 


(6) semaphore_p 对 信号 量 做 减 1 操 作 (SERE) : 


(7) semaphore_v 和 semaphore_p 类 似 ， 不 同 的 是 它 将 sembuf 结 构 
中 的 sem_op 设 置 为 1°。 这 是 一 个 “释放 ”操作 ， 它 使 信号 量变 为 可 用 : 


注意 ， 这 个 简单 的 程序 只 允许 每 个 程序 有 一 个 二 进 制 信号 量 。 虽 
然 我 们 可 以 通过 传递 信号 量变 量 的 方法 来 扩展 它 以 文 持 更 多 的 信和 号 
量 ， 但 通常 一 个 二 进 制 信号 量 即 已 足够 。 

我 们 可 以 通过 多 次 局 动 这 个 程序 的 方法 来 对 它 进行 测试 。 第 一 次 
局 动 时 加 上 一 个 参数 ， 表 示 应 该 由 它 来 负 员 创建 和 删除 信号 量 。 其 他 
的 调用 实例 不 使 用 参数 。 

下 面 是 两 个 程序 调用 实例 时 的 一 些 样 本 输出 : 


$ cc seml.c -o seml 


$ ./seml 
S is 
mm AXE I wi ~ AR vODYWYyYY 
OOXX JA JXXOOXXO QA XO VU JJ A UA AA 
1083 - finished 

m ^ * * 
1082 - finished 


请 记 住 ， 字 符 “O” 和 “X” 分 别 代 表 程序 的 第 一 个 和 第 二 个 调用 实 
例 。 因 为 每 个 程序 都 在 其 进入 和 离开 临界 区 域 时 打印 一 个 字符 ， 所 以 
每 个 字符 者 应 该 成 对 出 现 。 如 你 所 见 ， 字 符 o 和 x 是 成 对 出 现 的 ， 这 表 
明 对 临界 区 域 的 处 理 是 正确 的 。 如 果 这 个 程序 在 你 的 系统 上 不 能 正当 


工作 ， 你 可 能 需要 在 局 动 程 序 之 前 执行 命令 stty -tostop， 以 确保 产生 tty 
输出 的 后 台 程 序 不 会 引发 系统 生成 一 个 信号 。 

实验 解析 

在 程序 的 开始 ， 我 们 用 semget 范 数 通 过 一 个 (随意 选取 的 ) 键 来 
取得 一 个 信号 量 标识 符 。IPC_CREAT 标 志 的 作用 是 : 如 果 信 和 号 量 不 存 
在 ， 就 创建 它 。 

如 果 程 序 带 有 一 个 参数 ， 它 就 负责 信号 量 的 初始 化 工作 ， 这 和 是 通 
过 set_semvalue 函 数 来 完成 的 ， 该 函数 是 针对 更 通用 的 semctl 函 数 的 简 
化 接口 。 程 序 还 将 根据 是 否 带 有 参数 来 决定 需要 打印 哪个 字符 。sleep 
函数 的 作用 是 ， 让 我 们 有 时 间 在 这 个 程序 实例 执行 太 多 次 循环 之 前 调 
用 其 他 的 程序 实例 。 我 们 用 函数 srand 和 rand 来 为 程序 引入 一 些 伪 随 机 
形式 的 时 间 分 配 。 

接 下 来 程序 循环 10 次 ， 在 临界 区 域 和 非 临 界 区 域 会 分 别 暂停 一 段 
随机 的 上 时间。 临界 区 域 由 semaphore_p 和 semaphore_v 函 数 前 后 把 守 ， 
它们 是 更 通用 的 semop 函 数 的 简化 接口 。 

删除 信号 量 之 前 ， 带 有 参数 启动 的 程序 会 进入 等 待 状态 ， 以 允许 
其 他 调用 实例 都 执行 完毕 。 如 果 不 删 除 信号 量 ， 它 将 继续 在 系统 中 存 
在 ， 即 使 没有 程序 在 使 用 它 也 是 如 此 。 在 实际 的 编程 中 ， 我 们 需要 特 
别 小 心 ， 不 要 无 意 之 中 在 执行 结束 之 后 还 留 下 信号 量 末 删除 。 它 可 能 
会 在 你 下 次 运行 此 程序 时 引发 问题 ， 而 且 信 号 量 也 是 一 种 有 限 的 资 
源 ， 需 要 大 家 契约 使 用 。 


142 ”共享 内 存 


共享 内 存 是 3 个 IPC 机 制 中 的 第 二 个 。 它 允许 两 个 不 相关 的 进程 访 
问 同 一 个 逻辑 内 存 。 共 至 内 存 古 在 两 个 正在 运行 的 进程 之 间 传 递 数 据 
的 一 种 非常 有 效 的 方式 。 虽 然 X/Open 标 准 并 没有 对 它 做 出 要 求 ， 但 大 
多 数 共 至 内 存 的 具体 实现 ， 都 把 由 不 同 进程 之 间 共 至 的 内 存 安排 为 同 
一 段 物理 内 存 。 

共 至 内 存 是 由 IPC 为 进程 创建 的 一 个 特殊 的 地 址 范围 ， 它 将 出 现 
在 该 进程 的 地 址 空间 中 。 其 他 进程 可 以 将 同一 段 共 圣 内 存 连接 到 它们 
目 己 的 地 址 空间 中 。 所 有 进程 都 可 以 访问 共 至 内 存 中 的 地 址 ， 束 好 像 
它们 是 由 malloc 分 配 的 一 样 。 如 采 某 个 进程 向 共 至 内 存 写 入 了 数据 ， 
所 做 的 改动 将 立刻 被 可 以 访问 同一 段 共 至 内 存 的 任何 其 他 进程 看 天。 

共 至 内 存 为 在 多 个 进程 之 间 共 至 和 传递 数据 提供 了 一 种 有 效 的 方 
式 。 由 于 它 并 未 提供 同步 机 制 ， 所 以 我 们 通 冲 需要 用 其 他 的 机 制 来 同 
步 对 共有 至 内 存 的 访问 。 我 们 一 般 是 用 共 至 内 存 来 提供 对 大 块 内 存 区 域 
的 有 效 访问 ， 同 时 通过 传递 小 消息 来 同步 对 该 内 存 的 访问 。 

在 第 一 个 进程 结束 对 共 至 内 存 的 写 操作 之 前 ， 并 无 目 动 的 机 制 可 
以 阻止 第 二 个 进程 开始 对 它 进行 读 取 。 对 共 至 内 存 访 问 的 同步 控制 必 
须 由 程序 员 来 负 贡 。 图 14-2 显 示 了 共 吝 内存 是 如 何 工作 的 。 


进程 B 的 远 、 | 


辑 地 址 空间 


图 中 的 箭头 显示 了 每 个 进程 的 逻辑 地 址 空间 到 可 用 物理 内 存 的 映 
对 天 系 。 实 际 情况 要 比 图 中 显示 的 更 加 复杂 ， 因 为 可 用 内 存 实际 上 由 
物理 内 存 和 已 交换 到 磁盘 上 的 内 存 页 面 温 合 组 成 。 
共享 内 存 使 用 的 函数 类 似 于 信和 号 量 的 函数 ， 它 们 的 定义 如 下 : 
#include <sys/shm.h> 
void *shmat(int shm_id, const void *shm_addr, int shmflg); 
int shmctl(int shm id, int cmd, struct shmid ds *buf); 
int shmdt(const void *shm addr); 
int shmget(key t key, size t size, int shmflg); 
与 信号 量 的 情况 一 样 ， 头 文件 sys/types.h 和 sys/ipc.h 通 常 被 shm.h 自 
动 包含 进 程序 。 


14.2.1 shmgetERE 2 


我 们 用 shmget 函 数 来 创建 共享 内 存 : 
int shmget(key t key, size t size, int shmflg); 


与 信号 量 一 样 ， 程 序 需 要 提供 一 个 参数 key， 它 有 效 地 为 共享 内 存 
段 命 名 ，shmget 函 数 返 回 一 个 共享 内 存 标识 符 ， 该 标识 符 将 用 于 后 续 
的 共享 内 存 函 数 。 有 一 个 特殊 的 键 值 IPC_PRIVATE ， 它 用 于 创建 一 个 
只 属于 创建 进程 的 共享 内 存 。 通 常 你 不 会 用 到 这 个 值 ， 而 且 你 可 能 会 
发 现在 一 些 Linux 系 统 中 ， 私 有 的 共享 内 存 其 实 并 不 是 真正 的 私有 。 

第 二 个 参数 size 以 字 节 为 单位 指定 需要 共享 的 内 存 容量 。 

第 三 个 参数 shmflg 包 含 9 个 比特 的 权限 标志 ， 它 们 的 作用 与 创建 文 
件 时 使 用 的 mode 标 志 一 样 。 由 IPC_CREAT 定 义 的 一 个 特殊 比特 必须 
和 权限 标志 按 位 或 才能 创建 一 个 新 的 共享 内 存 段 。 设 置 IPC_CREAT 标 
志 的 同时 ， 给 shmget 函 数 传递 一 个 已 有 共享 内 存 段 的 键 并 不 是 一 个 错 
误 ， 如 果 无 需 用 到 IPC_CREAT 标 志 ， 该 标志 就 会 被 悄悄 地 名 略 掉 。 

权限 标志 对 共享 内 存 非常 有 用 ， 因 为 它们 允许 一 个 进程 创建 的 共 
享 内 存 可 以 被 共享 内 存 的 创建 者 所 拥有 的 进程 写 入 ， 同 时 其 他 用 户 创 
建 的 进程 只 能 读 取 该 共享 内 存 。 我 们 可 以 利用 这 个 功能 来 提供 一 种 有 
效 的 对 数据 进行 只 读 访 问 的 方法 ， 通 过 将 数据 放 入 共享 内 存 并 设置 它 
的 权限 ， 就 可 以 避免 数据 被 其 他 用 户 修改 。 

如 果 共 享 内 存 创建 成 功 ，shmget 返 回 一 个 非 负 整数 ， 即 共享 内 存 
标识 符 ; 如 果 和 失败， 就 返回 -1。 


14.2.2 shmat 


第 一 次 创建 共 译 内 存 段 时 ， 它 不 能 补 任 何 进 程 访问 。 要 想 启用 对 
该 共 至 内 存 的 访问 ， 必 须 将 其 连接 到 一 个 进程 的 地 址 空间 中 。 这 项 工 
作 由 shmat 范 数 来 完成 ， 它 的 定义 如 下 所 示 : 


void *shmat(int shm id, const void *shm_addr, int shmflg); 


第 一 个 参数 shm_id 是 由 shmget 返 回 的 共享 内 存 标识 符 。 

第 二 个 参数 shm_addr 指 定 的 是 共享 内 存 连接 到 当前 进程 中 的 地 址 
AEA 

第 三 个 参数 shmflg 是 一 组 位 标志 。 它 的 两 个 可 能 取 值 是 
SHM RND (这 个 标志 与 shm_addr 联 合 使 用 ， 用 来 控制 共享 内 存 连 接 
的 地 址 ) 和 SHM_RDONLY ( 它 使 得 连接 的 内 存 只 读 ) 。 我 们 很 少 需 


要 控制 共享 内 存 连 接 的 地 址 ， 通 常 都 是 让 系统 来 选择 一 个 地 址 ， 否 则 
就 会 使 应 用 程序 对 硬件 的 依赖 性 过 高 。 

如 果 shmat 调 用 成 功 ， 它 返回 一 个 指 问 共享 内 存 第 一 个 字 市 的 指 
针 ; 如 果 失 败 ， 它 就 返回 -1 e 

共享 内 存 的 读 写 权限 由 它 的 属 主 (共享 内 存 的 创建 者 ) 、 它 的 访 
oo BERE o HENE RU AFC 
[H 9 

这 个 规则 的 一 个 例外 是 ， 当 shmflg & SHM_RDONLY 为 tue 时 的 情 
况 。 此 时 即使 该 共享 内 存 的 访问 权限 允许 写 操作 ， 它 都 不 能 被 写 入 。 


14.2.3 shmdt 


shmdt 范 数 的 作用 是 将 共 至 内 存 从 当前 进程 中 分 离 。 d 
shmat 返 回 的 地 址 指针 。 成 功 时 它 返 回 9， 失 败 时 返回 -1。 注 意 ， 将 共 
享 内 存 分 离 并 未 删除 它 ， 只 是 使 得 该 共享 内 存 对 当前 进程 不 再 可 用 。 


14.2.4 shmctl 


55d ZR EE Be AOI, KSA GIP Re (非常 
谢 ) 要 稍微 简单 一 些 。 它 的 定义 如 下 所 示 : 
int shmctl(int shm id, int command, struct shmid ds *buf); 
shmid ds 结构 至 少 包 含 以 下 成 员 : 
SCIUCC snmid ds i 
uid t shm perm.uid; 
uid t shm perm.gid; 
mode t shm perm.mode; 


pal 
di 


} 


— Bes eae _id 是 shmget 返 回 的 共享 内 存 标 识 符 。 
ne 参数 command 是 要 采取 的 动作 ， 它 可 以 取 3 个 值 ， 如 表 14-2 
a o 
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命 E 说 请 
NI (Poti a oft C Ra "TT AF Py ^ fr f TE C 
mE PH eH. URGE OA 6r 0) JA NE mia coi n 9 OR 
BRU PAR 


soca ha OUR PE, EHI A APES ATR 
“成功 时 返回 0， 失 败 时 返回 -1 。X/Open 规 范 没有 定义 当 你 试图 删除 

一 个 正 处 于 连接 状态 的 共享 内 存 段 时 将 会 放生 的 情况 - > 通常 这 个 已 经 

被 删除 的 处 于 连接 状态 的 共享 内 存 段 还 能 继续 使 用 ， 直 到 它 从 最 后 一 

iri dE 分 离 为 止 。 人 所 以 最 好 不 
KINE ° 


x 验 共享 内 存 

介绍 完 共 享 内 存 函 数 后 ， 我 们 可 以 编写 一 些 代 码 来 使 用 它们 。 在 
这 个 实验 中 ， 2i. 对 程序 shm1.c 和 shm2.c。 第 一 个 程序 〈 消 
at ) 将 创建 一 共享 内 存 段 ， 然 后 把 写 到 它 里 面 的 数据 都 显示 出 
HE ° FB SREP aes 将 连接 一 个 已 有 的 共享 内 存 段 ， 并 允许 我 
们 向 其 下 输入 数据 o 

(1) 我 们 首先 创建 一 个 公共 的 头 文 件 ， 来 定义 我 们 和 希望 分 发 的 共 
享 内 存 。 我 们 将 其 命名 为 shm_com.h: 


| by. you: 
me: text[TEXT 52] i 


这 里 定义 的 结构 在 消费 者 和 生产 者 程序 中 都 会 用 到 。 当 有 数据 写 
入 这 个 结构 时 ， 我 们 用 该 结构 中 的 一 个 整 型 标志 written_by_you 来 通知 
消费 者 。 需 要 传输 的 文本 长 度 2K 是 由 我 们 随意 决定 的 。 
(2) 第 一 个 程序 shml.c 是 消费 者 程序 。 在 头 文件 之 后 ， 通 过 设置 
了 IPC_CREAT 标 志 位 的 shmget 调 用 来 创建 共享 内 存 段 (其 长 度 就 是 我 
们 的 共享 内 存 结构 的 长 度 ) : 


#include <unistd.h> 
finclude <stdlib.h> 
finclude <stdio.h> 
finclude <string.h>» 


$include <sys/shm.h> 
tinclude "gh com.h* 


int main(] 

i 
int running = 1; 
void *ahared_memory * {void *)0; 
struct shared use st *shared stuff; 
int shmid; 


arand((unsigned int]getpid(]!: 
&hmid = shsget(|key t)1234, sizeof|struct shared use st], 0666 | IPC CREAT]):; 
if (shmid == -1) | 

fprintf(stderr, "'shmget failedin"): 


exit (EXIT PAILURE! ; 
} 


N ki N ` —— 
(3) 现在 ， 让 程序 可 以 访问 这 个 共享 内 存 : 
shared memory = shmatí(shmid, (void *)0, 0); 
if (shared memory == [void *)-1) 
fprintf(stderr, “shmat falied\n*); 
exit|EXIT FAILURE}; 


print! ("Memory attached at Xin", liíntishared memory) 


(4) 程序 的 下 一 部 分 将 shared_memory 分 配给 shared_stuff， 


然后 


它 输 出 written_by_you 中 的 文本 。 循 环 将 一 直 执 行 到 在 written_by_you 
中 找到 end 字 符 串 为 止 。sleep 调 用 强迫 消费 者 程序 在 临界 区 域 多 待 一 会 


儿 ， 让 生产 者 程序 等 行 : 


Shared stuff = (struct shared use st *)ahared_memory; 
shared stuff-»written by you = 0; 
while(running) | 
if (shared stuff-»written by you) 1 
printfi(*You wrote: Ws*, shared stuff-»scme text); 
sieep( rand(] * 4 ]; /* make the other process wait for us 
shared stuff-»written by you = 0; 
if |strncmpishared stuff-»so0me text, *end*, 3) ws 0) { 


running = 0; 


) 


(5) 最 后 ， 共 享 内 存 被 分 离 ， 然 后 被 删除 : 


if [shmdt (shared memory) == -1) ( 
fprintf(atderr, 'shmdt failedin']; 
exit (EXIT_FAILURE) ; 

! 


if (mhmctl[shmid, IPC RMID, 0) == -1) ( 
fprintf(stderr, 'shmctlifPC RMID) failedin*): 
exit(EXIT PAILURE|; 

) 


exit (EXIT_SUCCESS); 


(6) 第 二 个 程序 shm2.c 是 生产 者 程序 ， 我 们 通过 它 向 消费 者 程序 


输入 数据 。 它 与 shm1.c 很 相似 ， 程 序 代码 如 下 所 示 : 


Sinclude <unistd.h> 
finclude <stdlib.h> 
finclude <stdio.h> 
tinclude <string.h> 


"include <sys/shm.h> 
finclude *shm com.h* 


int main() 

t 
int runníng * 1; 
void *shared memory = (void *]0; 
struct shared use st *shared stuff; 
char buffer[BUFSIZ]: 
int shmid; 


shmid = shmget((key t|1234. sizeof(struct shared use st), 0666 | IPC_CREAT); 


if (shmid == -1) [ 
fprintf|stderr, "shmget failedin"); 
exit (EXIT_FAILURE) ; 
) 
shared memory = shmat(shmid, (void *)0, 01; 
if (shared mesory == {void *)-1) | 
fprintf (stderr, "'shmat failed\n*); 
exit(EXIT FAILURE); 
) 


Printf|"Memory attached at WXin*, (int) shared_memory); 


运行 这 些 程序 时 ， 我 们 将 看 到 如 下 所 示 的 样本 输出 : 


Pa 


实验 解析 

第 一 个 程序 shm1 创 建 共享 内 存 段 ， 然 后 将 它 连 接 到 目 己 的 地 址 空 
间 中 。 我 们 在 共享 内 存 的 开始 处 使 用 了 一 个 结构 shared_use_st。 该 结 
构 中 有 个 标志 written_by_you， 当 共享 内 存 中 有 数据 写 入 时 ， 就 设置 这 
个 标志 。 这 个 标志 被 设置 时 ， 程 序 加 从 共享 内 存 中 读 取 文本 ， 将 它 打 
印 出 来 ， 然 后 清除 这 个 标志 表示 已 经 读 完 数据 。 我 们 用 一 个 特殊 字符 
串 end 来 退出 循环 。 接 下 来 ， 程 序 分 离 共享 内 存 段 并 删除 它 。 

第 二 个 程序 shm2 使 用 相同 的 键 1234 来 取得 并 连接 同一 个 共享 内 存 
段 。 然 后 它 提 示 用 户 输入 一 些 文本 。 如 果 标 志 written_by_you 被 设置 ， 
shm2 就 知道 客户 进程 还 未 读 完 上 一 次 的 数据 ， 因 此 就 继续 等 待 。 当 其 


他 进程 清除 了 这 个 标志 后 ，shm2 写 入 新 数据 并 设置 该 标志 。 它 还 使 用 
字符 串 end 来 终止 并 分 离 共 享 内 存 段 。 

注意 ， 我 们 只 能 提供 自己 的 、 非 常人 简陋 的 同步 标志 
written_by_you， 它 包括 一 个 非常 缺乏 效率 的 忙 等 待 (不 停 地 循环 ) 。 
这 可 以 使 得 我 们 的 示例 比较 简单 ， 但 在 实际 编程 中 ， 我 们 应 该 使 用 信 
号 量 或 通过 传递 消息 〈 使 用 管道 或 IPC 消 息 ， 后 者 我 们 在 下 一 节 就 会 
谈 到 ) 、 生 成 信号 (在 第 11 章 介绍 的 ) 的 方法 来 提供 应 用 程序 读 、 写 
部 分 之 间 的 一 种 更 有 效率 的 同步 机 制 。 


14.3 TÉ RAM 


我 们 现在 来 学 习 第 三 个 也 是 最 后 一 个 System VIPC 机 制 : 消息 队列 
(message queue) 。 消息 队 列 与 命名 管道 有 许多 相似 之 处 ， 但 少 了 在 
打开 和 关闭 管道 方面 的 复杂 性 。 但 使 用 消息 队列 并 未 解决 我 们 在 使 用 
命名 管道 时 过 到 的 一 些 问题 ， 比 如 管道 满 时 的 阻塞 问题 。 

消息 队列 提供 了 一 种 在 两 个 不 相关 的 进程 之 间 传 递 数据 的 相当 从 
单 且 有 效 的 方法 。 与 命名 管道 相 比 ， 消 息 队 列 的 优势 在 于 ， 它 独立 于 
发 送 和 接收 进程 而 存在 ， 这 消除 了 在 同步 命名 管道 的 打开 和 关闭 时 可 
能 产生 的 一 些 困难 。 

消息 队列 提供 了 一 种 从 一 个 进程 向 男 一 个 进程 发 送 一 个 数据 块 的 
方法 。 而 且 ， 每 个 数据 块 都 补 认 为 含有 一 个 类 型 ， 接 收 进程 可 以 独立 
地 接收 含有 不 同类 型 值 的 数据 块 。 好 消息 是 ， 我 们 可 以 通过 发 送 消 息 
来 几乎 完全 避免 命名 管道 的 同步 和 阻塞 问题 。 更 好 的 是 ， 我 们 可 以 用 
一 些 方 法 来 提前 查看 紧急 消息 。 坏 消息 是 : 与 管道 一 样 ， 每 个 数据 块 
都 有 一 个 最 大 长 度 的 限制 ， 系 统 中 所 有 队列 所 包含 的 全 部 数据 块 的 总 
长 度 也 有 一 个 上 限 。 

虽然 X/Open 规范 说 明 这 些 限制 是 强制 的 ， 但 它 并 未 提供 发 现 这 些 
限制 的 方法 ， 只 是 告诉 我 们 超过 这 些 限 制 是 引起 一 些 消息 队列 函数 失 
败 的 原因 之 一 。Linux 系 统 有 两 个 宏 定 义 MSGMAX 和 MSGMNB， 它 们 
以 字 节 为 单位 分 别 定义 了 一 条 消息 的 最 大 长 度 和 一 个 队列 的 最 大 长 
度 。 其 他 系统 中 的 这 些 宏 定义 可 能 会 不 一 样 或 甚至 根本 就 不 存在 。 

消息 队列 函数 的 定义 如 下 所 示 : 


#include <sys/msg.h> 


int msgctl(int msqid, int cmd, struct msqid ds *buf); 

int msgget(key t key, int msgfig); 

int msgrcv(int msqid, void *mag ptr, size t msg sz, long int msgtype, int msgflg); 
int msgsnd(int msqid, const void *mag ptr, size t msg sz, int msgflg); 


与 信号 量 和 共享 内 存 一 样 ， 头 文件 sys/typesh 和 sys/ipch 通 常 被 
msg.h 自 动 包含 进程 序 。 


14.3.4 msggetEX 2 
di TE msggetER BK Bi A f] — T YR Rs DA PT: 
int msgget(key t key, int msgflg); 


与 其 他 IPC 机 制 一 样 ， 程 序 必须 提供 一 个 键 值 来 命名 某 个 特定 的 
消息 队列 。 特 殊 键 值 IPC_PRIVATE 用 于 创建 私有 队列 ， 从 理论 上 来 
说 ， 它 应 该 只 能 被 当前 进程 访问 ， 但 同 信号 量 和 共享 内 存 的 情况 一 
样 ， 消 息 队 列 在 某 些 Linux 系 统 中 事实 上 并 非 私 有 。 由 于 私有 队列 没有 
什么 用 处 ， 所 以 这 并 不 是 一 个 很 严重 的 问题 。 与 以 前 一 样 ， 第 二 个 参 
数 msgflg 由 9 个 权限 标志 组 成 。 由 IPC_CREAT 定 义 的 一 个 特殊 位 必须 和 
权限 标志 按 位 或 才能 创建 一 个 新 的 消息 队列 。 在 设置 IPC_CREAT 标 志 
时 ， 如 果 给 出 的 是 一 个 已 有 消息 队列 的 链 也 不 会 产生 错误 。 如 采 消 息 
队列 已 有 ， 则 IPC_CREAT 标 志 就 被 悄悄 地 忽略 掉 。 

成 功 时 msgget 函 数 返 回 一 个 正 整 数 ， 即 队列 标识 符 ， 失 败 时 返 


回 -1 


14.3.2 ”msgsnd 国 数 


msgsnd 函 数 用 来 把 消息 添加 到 消息 队列 中 : 
int msgsnd(int msgid, const void *msg ptr, size t msg sz, int msgflg); 

消 筷 的 结构 受到 两 方面 的 约束 。 首 先 ， 它 的 长 度 必须 小 于 系统 规 
EWER; 其 次 ， 它 必须 以 一 个 长 整 型 成 员 变 量 开始 ， 接 收 函 数 将 用 
这 个 成 员 变 量 来 确定 消息 的 类 型 。 当 使 用 消息 时 ， 最 好 把 消息 结构 定 
义 为 下 面 这 样 : 

struct my message { 

long int message type; 

/* The data you wish to transfer */ 
} 

由 于 在 消息 的 接收 中 要 用 到 message_type， 所 以 你 不 能 忽略 它 。 
自己 的 数据 结构 时 包含 它 ， 并 且 最 好 将 它 初 始 化 为 一 个 

[MB o 

第 一 个 参数 msqid 是 由 msgget 函 数 返 回 的 消息 队列 标识 符 。 

第 二 个 参数 msg_ptr 是 一 个 指 辐 准 备 发 送 消 息 的 指针 ， 消 息 必 须 像 
刚才 说 的 那样 以 一 个 长 整 型 成 员 变 量 开始 。 

第 二 个 参数 msg_sz 是 msg_ptr 指 问 的 消息 的 长 度 。 这 个 长 度 不 能 包 
括 长 整 型 消 忌 类 型 成 员 变 量 的 长 度 。 

第 四 个 参数 msgflg 探 制 在 当前 消息 队列 满 或 队列 消息 到 达 系 统 范 
的 限制 时 将 要 发 生 的 事情 。 如 果 msgflg 中 设置 了 IPC_NOWAIT 标 
志 ， 函 数 将 立刻 返回 ， 不 发 送 消息 并 且 返 回 值 为 -1。 如 有 果 msgflg 中 的 


oe 除 ， 则 发 送 进 程 将 挂 起 以 等 待 队 列 中 腾 出 可 用 
空间 。 

成 功 时 这 个 函数 返回 90， 失败 时 返回 -1。 如 果 调 用 成 功 ， 消 息 数 据 
的 一 份 副本 将 被 放 到 消息 队列 中 。 


14.3.3 ”msgrcv 图 数 


msgrcv 函 数 从 一 个 消息 队列 中 获取 消息 : 
int magrcv(int msgid, void *msg ptr, size t mag sz, long int msgtype, int msgflg); 

第 一 个 参数 msqid 是 由 msgget 函 数 返 回 的 消息 队列 标识 符 。 

第 二 个 参数 msg_ptr 是 一 个 指 辣 准备 接收 消 居 的 指针 ， 消 娠 必须 像 
前 面 msgsnd 函 数 中 介绍 的 那样 以 一 个 长 整 型 成 员 变 量 开 始 。 

第 三 个 参数 msg_sz 是 msg_ptr 指 癌 的 消 居 的 长 度 ， 它 不 包括 长 整 型 
消息 类 型 成 员 变 量 的 长 度 。 

第 四 个 参数 msgtype 是 一 个 长 整数 ， 它 可 以 实现 一 种 简单 形式 的 接 
收 优先 级 。 如 果 msgtype 的 值 为 0， 就 获取 队列 中 的 第 一 个 可 用 消 恩 。 
如 果 它 的 值 大 于 零 ， 将 获取 具有 相同 消 四 类 型 的 第 一 个 消 轧 。 如 果 它 
RENTS, 将 获取 消息 类 型 等 于 或 小 于 msgtype 的 绝对 值 的 第 一 个 消 


这 个 函数 看 起 来 好 像 很 复杂 ， 但 实际 应 用 时 很 简单 。 如 果 只 想 按 
照 消息 发 送 的 顺序 来 接收 它们 ， 就 把 msgtype 设 置 为 0° 如 果 只 想 获 取 
某 一 特定 类 型 的 消息 ， 就 把 msgtype 设 置 为 相应 的 类 型 值 。 如 果 想 接收 
类 型 等 于 或 小 于 n 的 消息 ， 束 把 msgtype 设 置 为 -n。 

第 五 个 参数 msgflg 用 于 控制 当 队 列 中 没有 相应 类 型 的 消息 可 以 接 
收 时 将 发 生 的 事情 。 如 果 msgflg 中 的 IPC_NOWAIT 标 志 被 设置 ， 函 数 
将 会 立刻 返回 ， 返 回 值 是 -1。 如 果 msgflg 中 的 IPC_NOWAIT 标 志 被 清 
除 ， 进 程 将 会 挂 起 以 等 待 一 条 相应 类 型 的 消息 到 达 。 

成 功 时 msgrcv 函 数 返 回放 到 接收 缓存 区 中 的 字 节 数 ， 消 息 被 复制 
到 由 msg_ptr 指 向 的 用 户 分 配 的 缓存 区 中 ， 然 后 删除 消息 队列 中 的 对 应 
消息 。 失 败 时 返回 -1 ° 


14.3.4 ”msgctl 图 数 


最 后 一 个 消息 队列 函数 是 msgctl， 它 的 作用 与 共享 内 存 的 控制 画 
数 韭 党 相似 : 


int msgctl(int msqid, int command, struct msqid ds *buf); 


msqid_ds 结 构 至 少 包含 以 下 成 员 : 
struct msqid ds { 
uid t msg perm.uid; 
uid t msg perm.gid 
mode t msg perm.mode; 


第 一 个 参数 msqid 是 由 msgget 返 回 的 消息 队列 标识 符 。 
E 。 它 可 以 取 3 个 值 ， 如 表 
14-3 所 示 。 
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成 功 时 它 返 回 0， 失 残 时 返回 -1。 毁 课 猎 徐 消 息 队 列 时 ， 某 个 进程 正在 mscand 或 macrcv 函 数 中 符 
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成 功 时 它 返回 9， 失败 时 返回 -1。 如 果 删 除 消息 队列 时 ， 某 个 进程 
正在 msgsnd 或 msgrcv 函 数 中 等 待 ， 这 两 个 函数 将 失败 。 


实 验 消息 队列 
介绍 完 消 乱 队 列 的 定义 后 ， 我 们 来 看 它 的 实际 工作 情况 。 与 前 面 
一 样 ， 我 们 将 编写 两 个 程序 : msg1.c 用 于 接收 消息 ，msg2.c 用 于 发 送 
消 思 。 我 们 将 允许 两 个 程序 都 可 以 创建 消息 队列 ， 但 只 有 接收 者 在 接 
收 完 最 后 一 个 消息 之 后 可 以 删除 它 。 
(1) 下 面 是 接收 者 程序 msg1.c 的 代码 : 


$i wae «srdiib.h» 
Iin je <stdio.h> 
fir string.h» 
"inr rno.h» 
tin istd.! 
' msg 
long int msg tyr 
char som BUF 


int main!) 


int running = 1; 

int msgid; 

struct my meg 6t some data; 
long int msg to receive = 0 


(2) 首先 建立 消息 队列 : 


msgid = megget[(key t)1234, 0666 | IPC_CREAT): 


if (msgid == -1) 
fpri 人 "msgget failed with error: td\n*, errno) 
exit (EXIT_FAILURE) ; 

} 


(3) 然后 从 队列 中 获取 消息 ， 直 到 遇见 end 消 息 为 止 。 最 后 ， 删 
除 消息 队列 : 


while(running) { 
if (magrevimsgid, (void *)&some_data, BUFSIZ, 
msg to receive, 0) == -1] ( 
fprintf(stderr, "msgrcv failed with error: *din*, errno); 
exit (EXIT_FAILURE) ; 
} 
princtt(*You wrote: ts", some_data.some_text); 
if (strncmpisome data.scme text, "end*, 3) == 0) [ 
running = 0; 
) 
} 
if (msgctl(msgid, IPC RMID, 0) == -i) { 
fprintf(stderr, "msgctliIPC RMID) failedin*]; 
exit (EXIT_FAILURE); 
) 


exit (EXIT SUCCESS) |; 


(4) 发 送 痢 程序 msg2.c 与 msg1l.c 很 相似 。 在 main 函 数 的 变量 定义 
部 分 ， 删 除了 对 msg_to_receive 的 定义 并 把 它 蔡 换 为 buffer[BUFSIZ]。 
去 掉 删 除 消息 队列 的 语句 ， 在 running 循 环 中 做 如 下 的 改动 。 我 们 现在 
通过 调用 msgsnd 来 发 送 用 户 输入 的 文本 到 消息 队列 中 。 下 面 是 msg2.c 
的 代码 ， 阴 影 部 分 是 与 msgl.c 不 同 的 地 方 : 


#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <unistd.h> 


#include <sys/msg.h> 
#define MAX TEXT 512 


struct my_msg_st { 


long int my msg type; 
char some text {MAX TEXT]: 
P| 


int main}! 


int running * 1: 

struct my mag St some data; 
int msgiá; 

char baüffer[BUFS12]: 


msgid = msgget(|key t)1234, 0666 | IPC_CREAT): 


if (msgid ==-1) [ 
fprintfistderr, 'msggat failed with error: d\n", errno); 
exit|EXIT FAILURE): 

) 


whileirunning) ! 
printf("Enter some text: *):; 
fgetsibuffer, BUPSIZ, stdin): 
some data.my mag type = 1; 
strcpy(scme data.some text, buffer); 


if (msgsndimsgid, (void *)&some data, MAX TEXT, 0) == -1) ( 
fprintf(stderr, "msgsnd failedin*]; 
exit(EXIT FAILURE): 

} 

if [strncmp(buffer, *end*', 3) = 0) ( 
running = 0; 


) 
! 


exit[EXIT SUCCESS); 
) 


与 管道 例子 不 同 ， 这 里 不 再 需要 由 进程 目 己 来 提供 同步 方法 。 这 


征 请 县 相对 于 管道 的 一 个 明显 优势 。 

假设 消 恩 队列 中 有 空间 ， 发 送 痢 可 以 创建 队列 ， 放 一 些 数据 到 队 
列 中 ， 然 后 在 接收 者 局 动 之 前 束 退 出 。 我 们 将 先 运行 发 送 者 msg2。 下 
面 是 一 些 样本 输出 : 


$ ./msg2 

Enter some 
Enter some 
Enter some 
$ ./msgi 

You wrote: 
You wrote: 


You wrote: 
é 


实验 解析 


text: hello 
text: How are you today? 
text: end 


hello 
How are you today? 
end 


发 送 者 程序 通过 msgget 来 创建 一 个 消息 队列 ， 然 后 用 msgsnd 回 队 
列 中 增加 消息 。 接 收 者 用 msgget 获 得 消息 队列 标识 符 ， 然 后 开始 接收 
消息 ， 直 到 接收 到 特殊 的 文本 end 为 止 。 然 后 它 用 msgcdt 来 删除 消息 队 
列 以 完成 清理 工作 。 


14.4 CD v FA Fe 
现在 ， 我 们 可 以 用 在 本 章 中 学 到 的 IPC 机 制 来 修改 CD 数据 库 应 用 


[e 

我 们 可 以 使 用 这 3 种 IPC 机 制 的 不 同 组 合 方式 ， 但 考虑 到 需要 传递 
的 消息 非常 小 ， 所 以 直接 使 用 消息 队列 来 实现 请 求 和 咖 应 的 传递 应 该 
是 比较 合乎 情理 的 。 

如 果 需 要 传递 的 数据 量 很 大 ， 我 们 就 可 以 考虑 用 共享 内 存 来 传递 
实际 数据 ， 再 用 信号 量 或 消息 来 传递 一 个 “ 令 和 脾 ” 去 通知 其 他 进程 共享 
内 存 中 的 数据 已 可 用 。 

消息 队列 的 接口 省 去 了 我 们 在 第 11 章 中 遇 到 的 问题 ， 那 时 我 们 需 
要 在 数据 传递 过 程 中 两 个 进程 都 打开 管道 。 使 用 消息 队列 允许 一 个 进 
程 往 队 列 中 放 消 息 ， 即 使 这 个 进程 是 当前 该 队列 的 唯一 用 户 。 

唯一 需要 我 们 做 出 的 重要 决定 是 如 何 问 客户 返回 查询 结果 。 一 种 
简单 的 做 法 是 让 服务 器 用 一 个 队列 ， 每 个 客户 用 一 个 队列 。 但 如 果 并 
发 客户 数 太 大 ， 这 将 引起 问题 ， 因 为 需要 大 量 的 消息 队列 。 通 过 使 用 
消息 中 的 消息 ID 域 ， 就 可 以 允许 所 有 客户 只 使 用 一 个 队列 。 通 过 在 消 
已 中 使 用 客户 进程 ID， 束 可 以 把 啊 应 消息 和 特定 的 客户 进程 联系 起 
来 。 然 后 ， 每 个 客户 可 以 只 获取 那些 发 送 给 它 的 消息 ， 而 将 发 送 给 其 
他 客户 的 消息 留 在 队列 中 。 

要 想 把 我 们 的 CD 数据 库 应 用 程序 转换 为 使 用 IPC 机 制 ， 只 需要 更 
换 第 13 章 代码 中 的 文件 pipe_imp.c。 在 以 下 几 页 内 容 中 ， 我 们 将 介绍 
桩 换文 件 ipc_imp.c 中 的 核心 代码 。 


14.4.1 ”修改 服务 器 函数 


BC. m PAG ae ER AC o 
(1) 首先 ， 包 括 必要 的 头 文 件 ， 声 明 一 些 消息 队列 的 键 ， 然 后 定 
义 一 个 用 来 保存 消 轧 数据 的 结构 : 


(3) 我 们 让 服务 器 负责 创建 两 个 消息 队列 : 


(4) 服务 器 还 负责 在 退出 时 技 和 TREE LAF ° 服务 器 结束 时 ， 我 们 
将 文件 范围 的 变量 设置 为 无 效 值 。 当 服务 絮 在 调用 了 server_ending 后 
还 试图 发 送 滑 局 时 ， 这 种 做 法 可 以 捕获 到 这 样 的 错误 。 


(5) 服务 器 读 函 数 的 作用 是 : 从 队列 中 读 取 一 个 任 一 类 型 ( 即 来 
自任 意 客 户 ) 的 


e 返回 消息 的 数据 部 分 (忽略 消息 的 类 型 ): 


(6) 发 送 响应 时 ， 用 客户 进程 ID 来 编 址 消息 ， 客 户 进 程 ID 存放 


在 客户 的 请 求 中 : 
int send resp rto client (const message db t mesa to send 
Str 'eg pag g 
eit G TRAC 
Ser tp 
tend 
my nsg.real 2 4 


14.4.2 ”修改 客户 函数 


RE, ENAP KEI ° 
(1) 当 客 户 局 动 时 ， 它 需要 找到 服务 器 和 客户 队列 标识 符 。 客 户 
本 号 并 不 创建 队列 。 如 有 果 服 务 邵 没有 运行 ， 这 个 函数 吏 会 因 消 妃 队列 
不 存在 而 失败 。 


TRACI 


(2) 与 服务 器 一 样 ， 当 客户 结束 时 ， 我 们 将 文件 范围 的 变量 设置 
为 无 效 值 。 客 户 在 调用 了 client_ending 之 后 还 试图 发 送 消息 时 ， 这 种 
做 法 束 可 以 捕获 到 这 样 的 错误 。 


(3) 为 了 发 送 消 息 给 服务 器 ， 将 数据 存储 到 我 们 的 结构 中 。 注 
意 ， 我 们 必须 设置 消息 的 键 。 因 为 0 对 键 来 说 是 个 无 效 值 ， 而 如 果 不 对 
这 个 键 做 定义 就 意味 着 它 将 取 一 个 (显然 的 ) 随机 值 ， 如 果 磁 巧 这 个 
值 古 0 的 话 ， 这 个 函数 束 会 调用 失败 。 


tif DESUG, TRA 


(4) SRPMS aR MAEM, CAB CAIDA 
接收 发 送 给 它 的 消息 ， 而 忽略 发 送 给 其 他 客户 的 消息 。 


return 


(5) 为 了 保持 与 pipe_imp.c 的 完全 兼容 ， 我 们 还 需要 定义 4 个 函 


数 。 但 在 新 程序 中 ， 这 些 画 数 是 空 的 ， 因 为 现在 已 经 不 再 需要 它们 在 
使 用 管道 时 实现 的 操作 了 。 


我 们 现在 可 以 局 动 服 务 右 ， 它 在 后 合 完成 实际 的 数据 存储 和 检 
索 。 然 后 运行 客户 程序 ， 它 通过 消 恩 连接 服务 硕 。 

我 们 在 这 里 所 需要 做 的 就 是 将 第 11 章 中 的 接口 函数 替换 为 使 用 消 
恩 队 列 的 实现 。 将 应 用 程序 转换 为 使 用 消 乱 队列 展示 了 IPC 消 恩 队 列 
的 强大 。 因 为 与 使 用 管道 的 程序 相 比 ， 我 们 需要 使 用 的 函数 更 少 了 ， 
即使 那些 仍然 需要 使 用 的 函数 也 比 它们 以 前 的 实现 版 本 要 人 简单 得 多 。 


14.5 IPC 状态 命令 


虽然 X/Open 规范 并 没有 定义 它们 ， 但 大 多 数 Linux 系 统 都 提供 了 
一 组 命令 ， 用 于 从 命令 行 上 访问 IPC 信 息 以 及 清理 游离 的 IPC 机 制 。 它 
们 是 ipcs 和 ipcrm 命 令 ， 这 两 个 命令 对 于 开发 程序 非常 有 用 。 

IPC 机 制 一 个 让 人 烦恼 的 问题 是 : 编写 错误 的 程序 或 因为 某 些 原 
因而 执行 失败 的 程序 将 把 它 的 IPC 资 源 (如 消息 队列 中 的 数据 ， 遗留 
在 系统 中 ， 并 且 这 些 资 源 在 程序 结束 后 很 长 时 间 仍 然 在 系统 中 游荡 。 
这 将 导致 对 程序 的 新 调用 执行 失败 ， 因 为 程序 期 望 以 一 个 干净 的 系统 
来 启动 ， 但 事实 上 却 发 现 一 些 遗 留 的 资源 。 状 态 命令 (ipes) 和 删除 
命令 (pcm) 提供 了 一 种 检查 和 清理 IPC 机 制 的 方法 。 


14.5.1 显示 信号 量 状态 
要 检查 系统 中 信号 量 的 状态 ， 可 以 使 用 命令 ipcs -S$。 如 果 系 统 中 
有 信号 量 存 在 ， 就 会 给 出 如 下 格式 的 输出 ; 


S ./1pcs -8 


“ee Semaphore Arrays -------- 
key semid Owner perms nsems 
Ox4d00dfla 768 rick 666 1 


你 可 以 用 命令 ipcrm 来 删除 那些 因 意外 情况 而 被 程序 遗留 在 系统 
Pk 。 要 删除 上 面 的 信号 量 ， 使 用 的 命令 (在 Linux 系 统 中 ) 如 下 
ZN: 


$ ./ipcrm -s 768 
一 些 非常 老 的 Linux 系 统 使 用 一 个 稍微 不 同 的 命令 语法 : 
$ ./ipcrm sem 768 


但 这 种 命令 语法 现在 已 很 少 使 用 。 请 查看 系统 手册 页 来 确定 在 你 
的 特定 系统 中 应 该 使 用 的 正确 语法 格式 。 


14.5.2 显示 状态 


类 似 于 信号 量 ， 许 多 系统 提供 了 命令 行程 序 来 访问 共享 内 存 的 细 
节 情 况 。 它 们 是 命令 ipcs -m 和 ipcrm -m <id> (或 ipcrm shm <id>) ° 


下 面 是 一 些 ipcs -m 命 令 的 样本 输出 : 


S ipcs -m 

一 一 一 一 一 一 hared Memory Segments 

key shmid owner perms bytes nattch status 
0x00000000 384 rick 666 4096 2 dest 


T 这 里 显示 的 是 一 个 长 度 为 4KB 的 共享 内 存 段 ， 它 被 两 个 进程 连 
ES o 

ipcrm -m <id> 命 令 的 作用 是 删除 共享 内 存 。 如 果 程 序 因 运行 失败 
而 未 清理 共享 内 存 ， 这 个 命令 就 很 有 用 了 。 


14.5.3 ”显示 消息 状态 


用 于 消息 队列 的 命令 是 ipcs -q 和 ipcrm -q <id> (或 ipcrm msg 
<id>) 。 
下 面 是 命令 ipcs -q 的 一 些 样本 输出 : 


5 ipes -q 


key msqid owner perms used-bytes messages 
0x000004d2 3384 rick : 


这 显示 了 两 个 消 忠 ， 在 消 恩 队列 中 的 总 长 度 为 2 0484 5713 o 
ipcrm -q <id> 命 令 用 于 删除 一 个 消息 队列 。 


14.6 ”小结 


在 本 章 中 ， 我 们 介绍 了 3 种 进程 间 通 信 的 机 制 ， 它 们 最 早出 现在 
UNIX System V.2 版 本 中 ， 并 从 Linux 的 早期 版 本 开始 就 已 可 用 。 这 些 
机 制 是 信号 量 、 共 享 内 存 和 消 妃 队列 。 我 们 介绍 了 它们 所 提供 的 复杂 
功能 以 及 这 些 功 能 是 如 何 提 供 的 。 一 旦 我 们 理解 了 这 些 功 能 ， 它 们 就 
可 以 为 许多 进程 间 通 信 的 需求 提供 强 有 力 的 解决 方案 。 


Bile 套 fF F 


Ere, 我 们 将 介绍 进程 间 通 信 的 另 一 种 方法 ， 与 我 们 在 第 
13、14 章 讨论 的 方法 相 比 ， 它 有 着 明显 的 不 同 。 到 目前 为 止 ， 我 们 讨 
论 的 所 有 机 制 都 依靠 一 台 计 算 机 系统 的 共享 资源 实现 。 这 里 的 资源 可 
以 是 文件 系统 空间 、 共 享 的 物理 内 存 或 消息 队列 ， 但 只 有 运行 在 同一 
台 机 妖 上 的 进程 才能 使 用 它们 。 

伯克利 版 本 的 UNIX 系 统 引 入 了 一 种 狐 的 通信 工具 套 接 字 接 口 

(socket interface) ， 它 是 我 们 在 第 13 章 介绍 的 管道 概念 的 一 个 扩展 。 

Linux 系 统 文 持 套 接 字 接口 。 你 可 以 通过 与 使 用 管道 类 似 的 方法 来 使 用 
套 接 字 ， 但 套 接 字 还 包括 了 计算 机 网 络 中 的 通信 。 一 台 机 器 上 的 进程 
可 以 使 用 套 接 字 和 男 外 一 台 机 器 上 的 进程 通信 ， 这 样 束 可 以 支持 分 布 
在 网 络 中 的 客户 /服务 器 系统 。 同 一 台 机 絮 上 的 进程 之 间 也 可 以 使 用 套 
接 字 进行 通信 。 

此 外 ， 微 软 的 windows 系 统 也 通过 可 公开 获取 的 Windows Sockets 
技术 规范 〈 简 称 WinSock) 实现 了 套 接 字 接 口 。Windows 系 统 的 套 接 字 
服务 是 由 系统 文件 Winsock.dll 来 提供 的 。 因 此 ，Windows 程 序 可 以 通 
过 网 络 和 Linux/UNIX 计 算 机 进行 通信 来 实现 客户 /服务 器 系统 ， 反 之 亦 
然 。 虽 然 WinSock 的 编程 接口 和 UNIX 套 接 字 不 尽 相 同 ， 但 它 同样 是 以 
套 接 字 为 基础 的 。 

Linux 丰 富 的 网 络 功能 不 可 能 只 用 一 章 的 篇 幅 束 完全 涵盖 ， 所 以 我 
们 将 在 本 章 中 对 主要 的 网 络 编程 接口 进行 介绍 。 掌 握 了 本 章 的 内 容 
后 ， 你 天 可 以 开始 编写 目 己 的 网 络 程序 了 。 我 们 将 主要 介绍 下 面 的 内 


套 接 字 连接 的 工作 原理 

套 接 字 的 属性 、 地 址 和 通信 
网 络 信息 和 互联 网 守护 进程 (inetd/xinetd) 
客户 和 服务 大 


口 口 口 口 


15.1 人 是 


套 接 字 (socket) 是 一 种 通信 机 制 ， 和 赁 借 这 种 机 制 ， 客 户 /服务 器 
系统 的 开发 工作 既 可 以 在 本 地 单机 上 进行 ， 也 可 以 跨 网 络 进行 。Linux 
所 提供 的 功能 (如 打印 服务 、 连 接 数 据 库 和 提供 Web 页 面 ) 和 网 络 工 
具 (如 用 于 远程 登录 的 rlogin 和 用 于 文件 传输 的 ftp) 通常 都 是 通过 套 接 
字 来 进行 通信 的 。 

套 接 字 的 创建 和 使 用 与 管道 是 有 区 别 的 ， 因 为 套 接 字 明确 地 将 客 
户 和 服务 右 区 分 开 来 。 确 接 字 机 制 可 以 实现 将 多 个 客户 连接 到 一 个 服 


15.2 


你 可 以 把 套 接 字 连 接 想 象 为 打 电 话 进 一 个 党 忙 的 办 公 大 楼 。 一 个 
电话 打 到 一 家 公司 ， 接 线 员 接听 电话 并 把 它 转 到 正确 的 部 门 (服务 器 
进程 ) ， 然 后 再 从 那里 转 到 电话 要 找 的 人 (服务 器 套 接 字 ) 。 每 个 进 
入 的 电话 呼叫 (客户 ) 都 被 转 到 正确 的 终端 节点 ， 而 中 间 介 入 的 接线 
员 则 可 以 空 出 来 处 理 后 续 的 电话 。 在 开始 学 习 Linux 系 统 中 的 套 接 字 连 
接 是 如 何 建立 之 前 ， 我 们 需要 先 理 解 尽 接 字 应 用 程序 是 如 何 通过 套 接 
字 来 维持 一 个 连接 的 。 

首先 ， 服 务 器 应 用 程序 用 系统 调用 socket 来 创建 一 个 套 接 字 ， 它 
是 系统 分 配给 该 服务 器 进程 的 类 似 文 件 摘 述 簿 的 资源 ， 它 不 能 与 其 他 
进程 共享 。 

接 下 来 ， 服 务 器 进程 会 给 套 接 字 起 个 名 字 。 本 地 套 接 字 的 名 字 是 
Linux 文 件 系 统 中 的 文件 名 ， 一 般 放 在 /tmp 或 srtmp 目 了 永 中 。 对 于 网 
络 套 接 字 ， 它 的 名 字 是 与 客户 连接 的 特定 网 络 有 关 的 服务 标识 符 Qm 
口号 或 访问 点 ) 。 这 个 标识 符 允 许 Linux 将 进入 的 针对 特定 端口 号 的 连 
接 转 到 正确 的 服务 器 进程 。 例 如 ，Web 服 务 絮 一 般 在 80 端 口上 创建 一 
个 套 接 字 ， 这 是 一 个 专用 于 此 目的 的 标识 人行。Web 浏 贤 絮 知道 对 于 用 
户 想 要 访问 的 Web 站 点 ， 应 该 使 用 端口 80 来 建立 HTTP 连 接 。 我 们 用 系 
统 调 用 bind 来 给 套 接 字 命 名 。 然 后 服务 器 进程 就 开始 等 得 客户 连接 到 
这 个 命名 套 接 字 。 系 统 调 用 listen 的 作用 是 ， 创 建 一 个 队列 并 将 其 用 于 
目 客户 的 进入 连接 。 服 务 絮 通过 系统 调用 accept 来 接受 客户 的 
ETA n 
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得 当 ， 它 就 可 以 充分 利用 多 个 连接 带 来 的 好 处 。Web 服 务 器 束 会 这 入 
做 以 同时 服务 来 自 许 多 客户 的 页 面 请 求 。 对 一 个 简单 的 服务 器 来 说 ， 
后 续 的 客户 将 在 监听 队列 中 等 待 ， 直 到 服务 絮 再 次 准备 束 绪 。 

基于 套 接 字 系统 的 客户 端 更 加 简单。 客户 首先 调用 socket 创 建 一 
个 未 命名 万 接 字 ， 然 后 将 服务 器 的 命名 套 授 字 作 为 一 个 地 址 来 调用 
connect 与 服务 器 建立 连接 。 

一 旦 连接 建立 ， 我 们 就 可 以 像 使 用 压 层 的 文件 描述 符 那 样 用 套 接 
字 来 实现 双 同 的 数据 通信 。 


X 验 一 个 简单 的 本 地 客户 


下 面 是 一 个 非常 徐 单 的 套 接 字 客 户 程 序 的 例子 client1.c。 它 创建 一 
个 未 命名 的 套 接 字 ， 然 后 把 它 连接 到 服务 絮 套 接 字 server_socket。 天 于 
socket 系 统 调 用 的 细节 ， 我 们 将 在 讨论 完 与 地 址 相关 的 一 些 问 题 之 后 
再 来 介绍 。 
(1) 包含 一 些 必 要 的 头 文件 并 设置 变量 : 


"o o-- = «= 
" e e rA 
crcete ¢ 
anaana 
$ ( e o0 

E 


(2) 为 客户 创建 一 个 套 接 字 : 
sockfd = socket (AF UNIX, SOCK STREAM, 0); 
3 TETUR AS ar TDL? GAP pa 


address.sun fam 


tropy (acdres gun. path, "server socket’) 
+ * m" 
of [address 


E G dg are EES 


sockad | &ad 


(5) 现在 就 可 以 通过 sockfd 进 行 读 写 操作 了 : 
write(sockfd, &ch, 1); 
read(sockfd, &ch, 1); 
printf("char from server = %c\n", ch); 
close (sock£d) ; 
exit(0); 

} 


运行 这 个 程序 时 ， 它 会 失败 ， 因 为 你 还 没有 创建 服务 器 端的 命名 
gy (具体 的 错误 信息 将 随 系 统 的 不 同 而 不 同 ) 。 
$ ./client1 
oops: clientl: No such file or directory 
S 


Sc 验 一 个 简单 的 本 地 服务 器 
下 面 是 一 个 非常 简单 的 服务 万 程序 serverl.c， 它 接受 来 目 客户 程 
序 的 连接 。 它 首先 创建 一 个 服务 器 套 接 字 ， 将 它 绑 定 到 一 个 名 字 ， 然 
mm een (1) 包含 必要 的 头 文 
设 


2 ione. Fy ARS ia BE TR BA I BS : 


GU meee 


at "server socket 
un. path, Ber r SOCK 


oo 开始 等待 客户 进行 连接 


(5) 接受 一 个 连接 : 


(e) 对 client. sock: Ek 客户 进行 读 写 操作 : 


实验 解析 

这 个 例子 中 的 服务 部 程序 一 次 只 能 为 一 个 客户 服务 。 它 从 客户 那 
里 读 取 一 个 字符 ， 增 加 它 的 值 ， 然 后 再 把 它 写 回去 。 在 更 加 复杂 的 系 
统 中 ， 服 务 右 需要 为 每 个 客户 执行 更 多 的 处 理工 作 ， 这 种 一 次 只 为 一 
个 客户 服务 的 做 法 束 变 得 不 可 接受 了 ， 因 为 其 他 客户 只 有 等 到 服务 占 
结束 上 一 个 客户 的 处 理 任务 后 才能 处 理 它 的 连接 。 我 们 将 在 后 面 看 到 
几 个 允许 同时 处 理 多 个 连接 的 解决 方案 。 
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如 果 你 在 后 台 启 动 它 ， 让 它 独 立地 运行 ， 就 可 以 在 前 台 启 动 客户 程 


S ./serverl & 
[1] 1094 


S server waiting 


ARS dE FAS EE PBN SHARIR ELMS 
ee re ee ele eng Ed 

[È o 

记 住 : 用 完 一 个 套 接 字 后 ， 就 应 该 把 它 删除 掉 ， 即 使 是 在 程序 因 
接收 到 一 个 信号 而 异常 终止 的 情况 下 也 应 该 这 么 做 。 这 可 以 避免 文件 
系统 应 充斥 着 无 用 的 文件 而 变 得 混乱 。 


ls -1F server socket 


访问 权限 前 面 的 字母 s 和 这 一 行 末 尾 的 等 号 = 表示 该 设备 的 类 型 
是 “ 套 接 字 ”。 套 接 字 的 创建 过 程 与 普通 文件 一 样 ， 它 的 访问 权限 会 被 
当前 的 掩 码 值 所 修改 。 如 果 使 用 ps 命令 ， 你 可 以 看 到 服务 器 正 运行 在 
后 台 。 它 目前 处 于 休眠 状态 (STAT 栏 显示 的 是 S) ， 因 此 它 没有 消耗 
CPU 资 源 。 如 下 所 示 : 


$ ps lx 


现在 运行 客户 程序 ， 你 就 可 以 成 功 地 连接 到 服务 器 了 。 因 为 服务 
i E E 
ES 
$ ./client1 
server waiting 
char from server = B 
< 
服务 器 的 输出 和 客户 的 输出 在 我 们 的 终端 上 混在 了 一 起 ， 但 还 是 
可 以 看 出 服务 右 从 客户 那里 接收 了 一 个 字符 ， 将 它 的 值 增加 ， 然 后 再 
返回 它 。 接 着 服务 器 继续 运行 并 等 得 下 一 个 客户 的 到 来 。 如 果 同 时 运 


行 多 个 客户 ， 它 们 将 被 依次 服务 ， 但 你 看 到 的 输出 结果 可 能 会 更 加 混 
AL °c M0 RATA: 


$ ./clientl & ./clientl & ./clientl & 


[2] 23412 


fy 
1 
p. 
U 
tw 


15.2.1 j 


要 想 完 全 理解 在 上 面 例子 中 所 使 用 的 系统 调用 ， 你 需要 先 学 习 一 
些 UNIX 网 络 方面 的 知识 。 
套 接 字 的 特性 由 3 个 属性 确定 ， 它 们 是 : 域 (domain) 、 类 型 
(type) 和 协议 (protocol) 。 套 接 字 还 用 地 址 作为 它 的 名 字 。 地 址 的 
格式 随 域 〈 又 被 称 为 协议 族 ，protocol family) 的 不 同 而 不 同 。 每 个 协 
议 族 又 可 以 使 用 一 个 或 多 个 地 址 族 来 定义 地 址 格式 。 
1. 套 接 字 的 域 
域 指 定 套 接 字 通信 中 使 用 的 网 络 介 质 。 最 常见 的 套 接 字 域 是 
AF_INET， 它 指 的 是 Internet 网 络 ， 许 多 Linux 局 域 网 使 用 的 都 是 该 网 
络 ， 当 然 ， 因 特 网 自身 用 的 也 是 它 。 其 底层 的 协议 一 一 网 际 协议 
(IP) 只 有 一 个 地 址 族 ， 它 使 用 一 种 特定 的 方式 来 指定 网 络 中 的 计算 
机 ， 即 人 们 和 党 说 的 了 地址。 


“下 一 代 ” 互 联网 协议 Ipv6 被 设计 用 于 克服 标准 人 P 带 来 的 一 些 
问题 ， 特 别 是 可 用 地 址 数量 有 限 的 问题 。IPv6 使 用 一 个 不 同 的 套 
接 字 域 AF_ INET6 和 一 个 不 同 的 地 址 格式 。 人 们 期 望 它 能 最 终 替 
换 IP， 但 这 一 过 程 将 需要 经 过 许多 年 。 虽 然 Linux 也 文 持 Ipv6 实 
IL, 但 这 超出 了 本 书 介绍 的 范围 。 


虽然 我 们 几乎 总 是 用 域名 来 指定 因特网 上 的 联网 机 器 ， 但 它们 都 
会 被 转换 为 底层 的 IP 地 址 。 例 如 192.168.1.99 就 是 一 个 IP 地 址 。 所 有 的 
IP 地 址 都 用 4 个 数字 来 表示 ， 每 个 数字 都 小 于 256， 即 所 谓 的 点 分 四 元 
组 表示 法 (dotted quad) 。 当 客户 使 用 套 接 字 进 行 跨 网 络 的 连接 时 ， 
它 就 需要 用 到 服务 器 计算 机 的 IP 地 址 。 

服务 器 计算 机 上 可 能 同时 有 多 个 服务 正在 运行 。 客 户 可 以 通过 IP 
端口 来 指定 一 台 联 网 机 器 上 的 某 个 特定 服务 。 在 系统 内 部 ， 端 口 通 过 
分 配 一 个 唯一 的 16 位 的 整数 来 标识 ， 在 系统 外 部 ， 则 需要 通过 IP 地 址 
和 端口 号 的 组 合 来 确定 。 套 接 字 作为 通信 的 终点 ， 它 必须 在 开始 通信 
之 前 绑 定 一 个 端口 。 

服务 器 在 特定 的 端口 等 待 客户 的 连接 。 知 名 服务 所 分 配 的 端口 号 
在 所 有 Linux 和 UNIX 机 器 上 都 是 一 样 的 。 它 们 通常 (但 并 不 总 是 如 
此 ) 小 于 1024， 比 如 打印 机 缓冲 队列 进程 (515) ^rlogin (513) ^ 
ftp (21) 和 httpd (80) 等 。 其 中 最 后 一 个 承 是 Web 服务 器 的 标准 端 
口 。 一 般 情况 下 ， 小 于 1024 的 端口 号 都 是 为 系统 服务 保留 的 ， 并 且 所 
服务 的 进程 必须 具有 超级 用 户 权 限 。X/Open 规 范 在 头 文件 netdb.h 中 定 
义 了 一 个 常量 IPPORT_RESERVED， 它 代表 保留 端口 号 的 最 大 值 。 

因为 标准 服务 都 对 应 标准 的 端口 号 ， 所 以 计算 机 之 间 可 以 轻松 地 
互 连 ， 而 不 需要 首先 协商 一 个 正确 的 端口 号 。 本 地 服务 可 以 使 用 非 标 
准 的 端口 地 址 。 

第 一 个 例子 中 的 域 是 UNIX 文 件 系统 域 AF_UNIX， 即 使 是 一 台 还 
未 联网 的 计算 机 上 的 套 接 字 也 可 以 使 用 这 个 域 。 这 个 域 的 底层 协议 就 
是 文件 输入 /输出 ， 而 它 的 地 址 就 是 文件 名 。 我 们 的 服务 器 套 接 字 的 地 
址 是 server_socket， 当 我 们 运行 服务 絮 程 序 时 ， 束 可 以 在 当前 日 录 下 看 
到 这 个 地 址 。 

其 他 可 以 使 用 的 域 还 包括 : 基于 ISO 标准 协议 的 网 络 所 使 用 的 
AF_ISO 域 和 用 于 施乐 (Xerox) 网 络 系统 的 AF_XNS 域 。 它 们 都 不 在 
本 章 的 讨论 范围 之 内 。 

2， 套 接 字 类 型 

一 个 套 接 字 域 可 能 有 多 种 不 同 的 通信 方式 ， 而 每 种 通信 方式 义 有 
其 不 同 的 特性 。 但 AF_UNIX 域 的 套 接 字 没有 这 样 的 问题 ， 它 们 提供 了 
一 个 可 靠 的 双向 通信 路 径 。 在 网 络 域 中 ， 我 们 就 需要 注意 底层 网 络 的 
特性 ， 以 及 不 同 的 通信 机 制 是 如 何 受 到 它们 的 影响 的 。 

因特网 协议 提供 了 两 种 通信 机 制 : 流 (stream) 和 数据 报 
(datagram) 。 它 们 有 着 截然 不 同 的 服务 层次 。 

MET 


流 套 接 字 〈 在 某 些 方面 类 似 于 标准 的 输入 /输出 流 ) 提供 的 是 一 个 
有 序 、 可 靠 、 双 向 字 节 流 的 连接 。 因 此 ， 发 送 的 数据 可 以 确保 不 会 丢 
失 、 复 制 或 乱 序 到 达 ， 并 且 在 这 一 过 程 中 发 生 的 错误 也 不 会 显示 出 
来 。 大 的 消息 将 被 分 片 、 传 输 、 再 重组 。 这 很 像 一 个 文件 流 ， 它 接收 
大 量 的 数据 ， 然 后 以 小 数据 块 的 形式 将 它们 写 入 底层 人 磁盘 。 流 套 接 字 
的 行为 是 可 预见 的 。 

流 套 接 字 由 类 型 SOCK_STREAM 指 定 ， 它 们 是 在 AF_INET 域 中 通 
过 TCP/IP 连 接 实现 的 。 它 们 也 是 AF_UNIX 域 中 常用 的 套 接 字 类 型 。 在 
本 章 中 ， 我 们 将 重点 学 习 SOCK_STREAM 套 接 字 ， 因 为 它们 在 编写 网 
络 程 序 时 是 最 常用 的 。 


TCP/IP 代表 的 是 传输 控制 协议 (Transmission Control 
Protocol) /网 际 协议 (Internet Protocol) 。IP 协 议 是 针对 数据 包 的 
底层 协议 ， 它 提供 从 一 台 计 算 机 通过 网 络 到 达 另 一 台 计 算 机 的 路 
由 。TCP 协 议 提供 排序 、 流 控 和 重 传 ， 以 确保 大 数据 的 传输 可 以 
完整 地 到 达 目 的 地 或 报告 一 个 适当 的 错误 条 件 。 


"数据 报 套 接 字 

与 流 套 接 字 相反 ， 由 类 型 SOCK_DGRAM 指 定 的 数据 报 套 接 字 不 
建立 和 维持 一 个 连接 。 它 对 可 以 发 送 的 数据 报 的 长 度 有 限制 。 数 据 报 
作为 一 个 单独 的 网 络 消 息 被 传输 ， 它 可 能 会 丢失 、 复 制 或 乱 序 到 达 © 

数据 报 套 接 字 是 在 AF_INET 域 中 通过 UDP/IP 连 接 实现 的 ， 它 提供 
的 是 一 种 无 序 的 不 可 靠 服 务 (UDP 代 表 的 是 用 户 数 据 报 协议 ) 。 但 从 
资源 的 角度 来 看 ， 相 对 来 说 它们 开销 比较 小 ， 因 为 不 需要 维持 网 络 连 
接 。 而 且 因 为 无 需 花 费时 间 来 建立 连接 ， 所 以 它们 的 速度 也 很 快 。 

数据 报 适用 于 信息 服务 中 的 “ 单 次 ” (single-shot) 查询 ， 它 主要 用 
来 提供 日 常 状态 信息 或 执行 低 优先 级 的 日 志 记 录 。 它 的 优点 是 服务 器 
的 朋 识 不 会 给 客户 造成 不 便 ， 也 不 会 要 求 客户 重启 ， 因 为 基于 数据 报 
的 服务 器 通 溃 不 保留 连接 信息 ， 所 以 它们 可 以 在 不 打扰 其 客户 的 前 提 
下 停止 并 重启 。 

现在 ， 我 们 暂时 离开 对 数据 报 的 讨论 ， 关 于 数据 报 的 更 多 信息 请 
阅读 本 章 最 后 一 节 。 

3. 套 接 字 协议 

只 要 底层 的 传输 机 制 允 许 不 止 一 个 协议 来 提供 要 求 的 套 接 字 类 
型 ， 我 们 就 可 以 为 套 接 字 选择 一 个 特定 的 协议 。 在 本 草 中 ， 我 们 将 重 
点 讨论 UNIX 网 络 套 接 字 和 文件 系统 套 接 字 ， 它 们 不 需要 你 选择 一 个 特 
定 的 协议 ， 只 需要 使 用 其 默认 值 即 可 。 


15.2.2 创建 套 接 字 


socket 系 统 调 用 创建 一 个 套 接 字 并 返回 一 个 描述 符 ， 该 描述 符 可 
以 用 来 访问 该 套 接 字 。 
#include <sys/types.h> 
#include <sys/socket.h> 


int socket(int domain, int type, int protocol); 
创建 的 套 接 字 是 一 条 通信 线路 的 一 个 端点 。domain 参 数 指定 协议 
族 ，type 参 数 指 定 这 个 套 接 字 的 通信 类 型 ，protocol 参 数 指定 使 用 的 协 
议 。 
domain 参 数 可 以 指定 的 协议 族 如 表 15-1 所 示 。 


表 15-1 


Novell IPX I^ i 


Applet DDS 


最 常用 的 套 接 字 域 是 AF_UNIX 和 AF_INET， 前 者 用 于 通过 UNIX 
和 Linux 文 件 系 统 实现 的 本 地 套 接 字 ， 后 者 用 于 UNIX 网 络 套 接 字 。 
AEF_INET 套 接 字 可 以 用 于 通过 包括 因特网 在 内 的 TCP/P 了 网络 进行 通信 
° 微软 Windows 系 统 的 Winsock 接 口 也 提供 了 对 这 个 套 接 字 域 的 
访问 功能 。 

socket 落 数 的 参数 type 指 定 用 于 新 套 接 字 的 通信 特性 。 它 的 取 值 包 
括 SOCK_STREAM 和 SOCK_DGRAM ° 

SOCK_STREAM 是 一 个 有 序 、 可 靠 、 面 癌 连 接 的 双 同 字 下 流 。 对 
AF _INET 域 套 接 字 来 说 ， 它 默认 是 通过 一 个 TCP 连 接 来 提供 这 一 特性 
的 ，TCP 连 接 在 两 个 流 套 接 字 端点 之 间 建 立 。 数 据 可 以 通过 套 接 字 连 
接 进 行 双 回 传递 。TCP 协 议 所 提供 的 机 制 可 以 用 于 分 片 和 重组 长 消 
息 ， 并 且 可 以 重 传 可 能 在 网 络 中 丢失 的 数据 。 

SOCK_DGRAM 是 数据 报 服 务 。 我 们 可 以 用 它 来 发 送 最 大 长 度 固 
E (通常 比较 小 ) 的 消息 ， 但 消息 是 否 会 被 正确 传递 或 消息 是 否 不 会 
乱 序 到 达 并 没有 保证 。 对 于 AF_INET 域 套 接 字 来 说 ， 这 种 类 型 的 通信 
是 由 UDP 数据 报 来 提供 的 。 


通信 所 用 的 协议 一 般 由 套 接 字 类 型 和 套 接 字 域 来 决定 ， 通 常 不 需 
要 选择 。 只 有 当 需 要 选择 时 ， 我 们 才 会 用 到 protocol 参 数 。 将 该 参数 设 
置 为 0 表示 使 用 默认 协议 ， 我 们 将 在 本 章 的 所 有 例子 中 都 这 样 做 。 

socket 系 统 调用 返回 一 个 描述 符 ， 它 在 许多 方面 都 类 似 于 撒 层 的 
文件 描述 符 。 当 这 个 套 接 字 连 接 到 另 一 端的 克 接 字 后 ， 我 们 束 可 以 用 
read 和 write 系统 调用 ， 通 过 这 个 摘 述 符 来 在 套 接 字 上 发 送 和 接收 数据 
了 。close 系 统 调用 用 于 结束 套 接 字 连 接 。 


15.2.3 地 址 


每 个 套 接 字 域 都 有 其 自己 的 地 址 格式 。 对 于 AF_UNIX 域 套 接 字 来 
说 ， 它 的 地 址 由 结构 sockaddr_un 来 描述 ， 该 结构 定义 在 头 文件 sys/un.h 
中 o 


struct sockaddr_un { 
sa_family t sun_family; /* AF_UNIX */ 
char sun path[]; /* pathname */ 


因此 ， 对 套 接 字 进行 处 理 的 系统 调用 可 能 需要 接受 不 同类 型 的 地 
址 ， 每 种 地 址 格式 都 使 用 一 种 类 似 的 结构 来 描述 ， 它 们 都 以 一 个 指定 
地 址 类 型 ( 套 接 字 域 ) 的 成 员 (在 本 例 中 是 sun_family) 开始 。 在 
AF_UNIX 域 中 ， 套 接 字 地 址 由 结构 中 的 sun_path 成 员 中 的 文件 名 所 指 
定 


在 当前 的 Linux 系 统 中 ， 由 X/Open 规 范 定义 的 类 型 sa_family_t 在 头 
文件 sysmun.h 中 声明 ， 它 是 短 整 数 类 型 。 此 外 ，sun_path 指 定 的 路 径 名 
长 度 也 是 有 限制 的 Linux 规 定 的 是 108 个 字符 ， 其 他 系统 可 能 使 用 的 
是 更 清楚 的 常量 ， 如 UNIX_MAX_PATH) 。 因 为 地 址 结构 的 长 度 不 一 
致 ， 所 以 许多 套 接 字 调 用 需要 用 到 一 个 用 来 复制 特定 地 址 结构 的 长 度 
变量 或 将 它 作 为 一 个 输出 。 

在 AF_INET 域 中 ， 套 接 字 地 址 由 结构 sockaddr_ in 来 指定 ， 该 结构 
定义 在 头 文件 netinet/in.h 中 ， 它 至 少 包 含 以 下 几 个 成 员 : 


struct sockaddr in { 


} 


short int sin family; /* AF INET */ 
unsigned short int sin port; /* Port number */ 
struct in addr sin addr; /* Internet address */ 


): 


IP 地 址 结构 in_addr 被 定义 为 : 


struct in_addr { 
unsigned long int s addr; 
); 
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的 域 、 卫 地 址 和 端口 号 来 完全 确定 。 从 应 用 程序 的 角度 来 看 ， 所 有 套 
接 字 的 行为 束 像 文件 接 述 符 一 样 ， 并 且 通 过 一 个 唯一 的 整数 值 来 区 
分 o 


15.2.4 ”命名 套 接 字 


要 想 让 通过 socket 调 用 创建 的 套 接 字 可 以 被 其 他 进程 使 用 ， 服 务 
SR ERI BUD AI VA EET inda ^ IURE, AF UNIXZEBET BLA ASI — 
个 文件 系统 的 路 径 名 ， 正 如 你 在 server1 例 子 中 所 看 到 的 。AF_INET 套 
接 字 融会 天 联 到 一 个 IP 端 口号 。 


#include «sys/socket.h» 


int bind(int socket, const struct sockaddr *address, size t address len); 


bind 系 统 调用 把 参数 address 中 的 地 址 分 配给 与 文件 摘 述 符 socket 天 
联 的 未 命名 套 接 字 。 地 址 结构 的 长 度 由 参数 address_len 传 递 。 

地 址 的 长 度 和 格式 取决 于 地 址 族 。bind 调 用 需要 将 一 个 特定 的 地 
址 结构 指针 转换 为 指向 通用 地 址 类 型 (struct sockaddr *) ° 
bind 调 用 在 成 功 时 返回 0， 失 败 时 返回 -1 并 设置 errno 为 表 15-2 中 的 


表 15-2 
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AF_UNIX 域 套 接 字 还 有 其 他 一 些 错 误 代 码 ， 如 表 15-3 所 示 。 


表 15-3 
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15.2.5 J 多 


为 了 能 够 在 套 接 字 上 接受 进入 的 连 授 ， 服 务 器 程序 必须 创建 一 个 
队列 来 保存 未 处 理 的 请 求 。 它 用 listen 系 统 调用 来 完成 这 一 工作 。 


#include <sys/socket.h> 


int listen(int socket, int backlog); 


Linux 系 统 可 能 会 对 队列 中 可 以 容纳 的 未 处 理 连 接 的 最 大 数目 做 出 
限制 。 为 了 遵守 这 个 最 大 值 限 制 ，listen 函 数 将 队列 长 度 设置 为 backlog 
参数 的 值 。 在 套 接 字 队 列 中 ， 等 待 处 理 的 进入 连接 的 个 数 最 多 不 能 超 
过 这 个 数字 。 再 往 后 的 连接 将 被 拒绝 ， 导 致 客户 的 连接 请 求 失败 。 
listen 函 数 提 供 的 这 种 机 制 允 许 当 服务 器 程序 正人 忙于 处 理 前 一 个 客户 请 
将 后 续 的 客户 连接 放 入 队列 等 竺 处理。backlog 参 数 党 用 的 

是 5 © 

listen 函数 在 成 功 时 返回 0， 失 败 时 返回 -1。 错 误 代 码 包 括 
EBADF、EINVAL 和 ENOTSOCK， 其 含义 与 上 面 bind 系 统 调用 中 说 明 
的 一 样 。 


15.2.6 ”接受 连接 


— BARS ae Te Y OSEE an 4 T BHF ZUR. 它 就 可 以 通过 accept 
系统 调用 来 等 得 客户 建立 对 该 套 接 字 的 连接 。 


#include «sys/socket.h» 


accept 系 统 调用 只 有 当 有 客户 程序 试图 连接 到 由 socket 参 数 指定 的 
套 接 字 上 时 才 返 回 。 这 里 的 客户 是 指 ， 在 套 接 字 队 列 中 排 在 第 一 个 的 
未 处 理 连接 。accept 函 数 将 创建 一 个 新 套 接 字 来 与 该 客户 进行 通信 ， 
du COT PUPPI o 新 套 接 字 的 类 型 和 服务 器 监听 套 接 字 类 
型 是 一 样 的 。 

套 接 字 必须 事先 由 bind 调 用 命名 ， 并 且 由 listen 调 用 给 它 分 配 一 个 
连接 队列 。 连 接客 户 的 地 址 将 被 放 入 address 参 数 指 加 的 sockaddr 结 构 
。 如 采 我 们 不 关心 客户 的 地 址 ， 也 可 以 将 address 参 数 指定 为 空 指 


参数 address_len 指 定 客户 结构 的 长 度 。 如 果 客 户 地 址 的 长 度 超过 
这 个 值 ， 它 将 被 截断 。 所 以 在 调用 accept 之 前 ，address_len 必 须 被 设置 


为 预期 的 地 址 长 度 。 当 这 个 调用 返回 时 ，address_len 将 被 设置 为 连接 
客户 地 址 结构 的 实际 长 度 o 
如 果 套 接 字 队列 中 没有 未 处 理 的 连接 ，accept 将 阻塞 〈 程 序 将 暂 
f) 直到 有 客户 建立 连接 为 止 。 我 们 可 以 通过 对 套 接 字 文 件 描述 符 设 
置 O_ NONBLOCK 标 志 来 改变 这 一 行为 ， 使 用 的 函数 是 fcntL， 如 下 所 
ZN: 
int flags = fcntl(socket, F GETFL, 0); 


fcntl(socket, F SETFL, O_NONBLOCK| flags) ; 


当 有 末 处 理 的 客户 连接 时 ，accept 函 数 将 返回 一 个 新 的 套 接 字 文 
件 描述 符 。 发 生 错 误 时 ，accept 函 数 将 返回 -1。 可 能 的 错误 情况 大 部 分 
与 bind、listen 调 用 类 似 ， 其 他 的 错误 有 EWOULDBLOCK 和 EINTR ° 
前 者 是 当 指 定 了 O_NONBLOCK 标 志 ,， 但 队列 中 没有 未 处 理 连接 时 产 
生 的 错误 。 后 者 是 当 进 程 阻塞 在 accept 调 用 时 ， 执 行 被 中 断 而 产生 的 


客户 程序 通过 在 一 个 未 命名 肆 接 字 和 服务 器 监听 套 接 字 之 间 建 立 
连接 的 方法 来 连接 到 服务 器 。 它 们 通过 connect 调 用 来 完成 这 一 工作 。 


int connect(int socket, const struct sockaddr *address, size t address len); 


参数 socket 指 定 的 套 接 字 将 连接 到 参数 address 指 定 的 服务 絮 套 接 
字 ，address 指 向 的 结构 的 长 度 由 参数 address_len 指 定 。 参 数 socket 指 定 
的 套 接 字 必 须 是 通过 socket 调 用 获得 的 一 个 有 效 的 文件 摘 述 伯 。 

成 功 时 ，connect 调 用 返回 0， 失 败 时 返回 -1。 可 能 的 错误 代码 见 表 
15-4 » 
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如 果 连 接 不 能 立刻 建立 ， connect 调 用 将 阻塞 一 段 不 确定 的 超时 时 
间 。 一 旦 这 个 超时 时 间 到 达 ， 连 接 将 被 放弃 ，connect 调 用 失败 。 但 如 
果 connect 调 用 被 一 个 信号 中 断 ， 而 该 信号 又 得 到 了 处 理 ，connect 调 用 


还 是 会 失败 (errno 被 设置 为 EINTR) ， 但 连接 党 试 并 不 会 被 放弃 ， 而 
cea 式 继续 建立 ， 程 序 必 须 在 此 后 进行 检查 以 查看 连接 是 否 成 
功 建立 。 

与 accept 调 用 一 样 ，connect 调 用 的 阻塞 特性 可 以 通过 设置 该 文件 
描述 符 的 O NONBLOCK 标 志 来 改变 。 此 时 ， 如 果 连 接 不 能 立刻 建 
并 ，connect 将 失败 并 把 errno 设 置 为 EINPROGRESS， 而 连接 将 以 异步 
方式 继续 进行 。 

虽然 异步 连接 难于 处 理 ， 但 我 们 可 以 在 套 接 字 文 件 摘 述 符 上 ， 用 
select 调 用 来 检查 套 接 字 是 否 已 处 于 写 就 绪 状 态 。 我 们 将 在 本 章 的 后 面 


介绍 select 调 用 。 


15.2.8 ”关闭 套 接 字 


你 可 以 通过 调用 close 函 数 来 终止 服务 器 和 客户 上 的 套 接 字 连 接 ， 
就 如 同 对 底层 文件 描述 符 进 行 关 闭 一 样 。 你 应 该 总 是 在 连接 的 两 端 都 
关闭 套 接 字 。 对 于 服务 器 来 说 ， 应 该 在 read 调 用 返回 0 时 关闭 套 接 字 ， 
但 如 果 套 接 字 是 一 个 面向 连接 类 型 的 ， 并 且 设 置 了 SOCK_LINGER 选 
项 ，close 调 用 会 在 该 套 接 字 还 有 未 传输 数据 时 阻塞 。 你 将 在 本 章 后 面 
的 内 容 中 学 习 到 如 何 设置 套 接 字 选项 。 


15.2.9 通 


在 介绍 完 与 套 接 字 相关 的 基本 系统 调用 后 ， 我 们 来 看 几 个 示例 程 
序 。 我 们 将 尽量 使 用 网 络 套 接 字 而 不 是 文件 系统 套 搂 字 。 文 件 系 统 
接 字 的 缺点 和 是， 除非 程序 员 使 用 一 个 绝对 路 径 名 ， 否 则 套 接 字 将 创建 
在 服务 絮 程 序 的 当前 目录 下 。 为 了 让 它 更 具 通 用 型 ， 你 需要 将 它 创 建 
在 一 个 服务 器 及 其 客户 都 认可 的 可 全 局 访问 的 目录 (如 /tmp 目 录 ) 
i © TE IARE BECK ORYR. UR NS EGER PAR EA B3 SB 
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我 们 的 例子 将 选择 端口 号 9734， 这 个 端口 号 是 在 避 开 标准 服务 的 
前 提 下 随意 选择 的 〈 我 们 不 能 使 用 小 于 1024 的 端口 号 ， 因 为 它们 都 是 
为 系统 使 用 保留 的 ) 。 其 他 闯 口 号 及 通过 它们 提供 的 服务 通 芝 都 列 在 
系统 文件 /etc/services 中 。 编 写 基于 套 接 字 的 应 用 程序 时 ， 请 注意 总 要 
选择 没有 列 在 该 配置 文件 中 的 端口 号 。 


请 注意 在 程序 client2.c 和 server2.c 中 有 个 我 们 故意 设置 的 错 
误 ， 我 们 将 在 client3.c 和 server3.c 中 修复 这 个 错误 。 所 以 请 不 要 将 
client2.c 和 server2.c 中 的 代码 用 到 你 自己 的 程序 中 。 


我 们 将 在 局 域 网 中 运行 我 们 的 客户 和 服务 器 ， 但 网 络 套 接 字 不 仅 
可 用 于 局 域 网 ， 任 何 带 有 因特网 连接 〈 即 使 是 一 个 调制 解 调 器 拨号 连 
fe) 的 机 器 都 可 以 使 用 网 络 套 接 字 来 彼此 通信 。 甚 至 可 以 在 ss 
单机 上 运行 基于 网 络 的 程序 ， 因 为 UNIX 计 算 机 通常 会 配置 了 一 个 只 包 
含 它 自身 的 回路 (loopback) 网 络 。 出 于 演示 的 目的 ， 我 们 将 使 用 这 
个 回路 网 络 。 回 路 网 络 对 调试 网 络 应 用 程序 也 很 有 用 ， 因 为 它 排 除了 
任何 外 部 网 络 问题 。 

回路 网 络 中 只 包含 一 台 计 算 机 ， 传 统 上 它 被 称 为 localhost， 它 有 
一 个 标准 的 IP 地 址 127.0.0.1°。 这 就 是 本 地 主机 。 你 可 以 在 网 络 主机 文 
件 /etc/hosts 中 找到 它 的 地 址 ， 在 该 文件 中 还 列 出 了 在 共享 网 络 中 的 其 
他 主机 的 名 字 和 对 应 的 地 址 。 

每 个 与 计算 机 进行 通信 的 网 络 都 有 一 个 与 之 关联 的 硬件 接口 。 一 
台 计 算 机 可 能 在 每 个 网 络 中 都 有 一 个 不 同 的 网 络 名 ， 当 然 也 就 会 有 几 
个 不 同 的 人 P 地 址 。 例 如 ，Neil 的 机 器 tilde 束 有 3 个 网 络 接口 ， 因 此 也 就 
有 3 个 下 地 址 o 它们 被 记录 在 文件 /etchosts 中 ， 如 下 所 示 : 
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ae MNAE, 第 二 个 是 通过 一 块 以 太 网卡 来 访问 
的 局 域 网 ， 征 到 ou mn Ae 
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何 一 个 网 络 接口 与 服务 器 进行 通信 。 


S 验 网 络 客户 

下 面 是 一 个 修改 过 的 客户 程序 client2.c， 它 通过 回路 网 络 连 接 到 一 
个 网 络 套 接 字 。 这 个 程序 有 一 个 与 硬件 相关 的 细微 错误 ， 我 们 将 在 本 
章 的 后 面 再 讨论 它 。 

(1) 包含 必要 的 头 文件 并 设置 变量 


ide <sys/types.h> 
Clude «sys/Ssocker.n» 
include <stdio.h> 
nciude SLIOlo.n- 


iinclude <netinet/in.h> 
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ate 
#include <arpa/inet.h> 
finclude <unistd.h> 
#include <stdlib.h> 


sockaddr_in address; 


cna 


(2) 为 客户 创建 一 个 套 接 字 : 
sockfd = socket (AF_INET, SOCK_STREAM, 0) ; 
(3) 命名 套 接 字 ， 与 服务 器 保持 一 致 : 
address.sin_family = AF_INET; 
address.sin_addr.s_addr = inet_addr("127.0.0.1"); 
address.sin_port = 9734; 
len = sizeof (address); 
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本 的 客户 程序 时 ， 它 将 连接 失败 ， 因 为 还 没有 服务 器 运行 在 这 台 计 算 
机 的 9734 端 口上 。 
$ ./client2 
oops: client2: Connection refused 
$ 
实验 解析 
客户 程序 用 在 头 文件 netineUyin.h 中 定义 的 sockaddr_ in 结构 指定 了 一 
个 AF_INET 地 址 。 它 试图 连接 到 IP 地 址 为 127.0.0.1 的 主机 上 的 服务 
器 。 它 用 inet_addr 函 数 将 下 地 址 的 文本 表示 方式 转换 为 符合 父 接 字 地 
址 要 求 的 格式 。inet 的 手册 页 中 有 对 其 他 地 址 转换 函数 的 详细 说 明 。 


x o 网 络 服务 器 | 

你 还 需要 修改 服务 器 程序 ， 让 它 在 选 好 的 端口 号 上 等 待 客户 的 连 
接 。 下 面 是 修改 过 的 服务 器 程序 server2.c « 

(1) 包含 必要 的 头 文件 并 设置 变量 : 


#include «sys/type: 
#include S 


finclude <netinet/in.h> 
finclude «arpa/inet,.h» 


include <unistd.h> 
finclude <stdlib.h> 
nt maini) 


int server sockfd, client, sockfd 
int server len ient iem; 

struct sockaddr.in server. address; 
struct sockaddr.in client, address; 


(2) 为 服务 器 创建 一 个 未 命名 套 接 字 : 
server_sockfd = socket (AF INET, SOCK STREAM, 0) ; 
(3) 命名 套 接 字 : 


server_address.sin_family = AF_INET; 
server address.sin addr.s addr = inet addr("127.0 
server address.sin port = 9734; 

rye f 2 ivan cerver idiress 


从 这 以 后 的 代码 与 serverl.c 完 全 一 样 。 运 行 client2 和 server2 将 显示 
与 你 在 前 面 运 行 client1 和 server1 一 样 的 结 

实验 解析 

服务 絮 程 序 创建 一 个 AF_INET 域 的 套 接 字 ， 并 安排 在 它 之 上 接受 
连接 。 这 个 套 接 字 被 绑 定 到 你 选择 的 端口 。 指 定 的 地 址 决定 了 人 允许 建 
立 连 接 的 计算 机 。 通 过 指定 像 客 尸 程 序 中 一 样 的 回路 地 址 ， 你 束 把 通 
信和 限制 在 本 地 主机 上 。 

如 果 想 允许 服务 妖 和 远程 客户 进行 通信 ， 束 必须 指定 一 组 你 允许 
连接 的 了 PP 地址 。 你 可 以 用 特殊 值 INADDR_ANY 来 表示 ， 你 将 接受 来 目 
计算 机 任何 网 络 接口 的 连接 。 如 果 你 愿意 ， 还 可 以 通过 分 离 如 内 部 局 
域 网 和 外 部 广域网 连接 的 方式 来 区 分 不 同 的 网 络 接口 。 
INADDR_ANY 是 一 个 32 位 的 整数 值 ， 它 可 以 用 在 地 址 结构 的 
sin_addrs_addr 域 中 。 但 首先 你 需要 解决 一 个 问题 ， 如 下 节 所 示 。 


15.2.10 + A 
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序 时 ， 我 们 可 以 用 netstat 命 令 来 查看 网 络 连 接 状况 。 这 个 命令 在 大 多 
数 配 置 了 网 络 功能 的 UNIX 系 统 上 都 能 找到 。 它 显示 了 客户 /服务 大 连 
接 正在 等 待 关闭 。 连 接 将 在 一 小 段 超时 时 间 之 后 关闭 (具体 的 输出 内 
容 将 随 Linux 版 本 的 不 同 而 不 同 ) 。 


$ ./server2 & ./client2 


nar from server = 
$ netstat -A inet 


Cc} 


在 尝试 运行 本 书 中 其 他 示例 程序 之 前 ， 请 确保 已 终止 正在 运 
行 的 示例 服务 器 程序 ， 因 为 它们 会 争夺 来 自 客户 的 连接 ， 会 导致 
运行 结果 混乱 。 你 可 以 用 下 面 的 命令 来 将 它们 (包括 本 章 后 面 将 
介绍 的 示例 程序 ) EAH: 


kilall server1 server2 server3 server4 server5 


你 可 以 看 到 这 条 连接 对 应 的 服务 器 和 客户 的 端口 号 。local address 
- 栏 显 示 的 是 服务 器 ， 而 foreign address 一 栏 显示 的 是 远程 客户 (即使 

是 在 同一 台 机 器 上 ， 它 仍然 是 通过 网 络 连 接 的 ) 。 为 了 确保 所 有 套 接 
字 都 是 不 同 的 ， 这 些 客户 端口 一 般 都 与 服务 器 监听 套 接 字 不 同 ， 并 且 
在 这 台 计 算 机 上 是 唯一 的 。 

可 是 ， 显 示 的 本 地 地 址 (服务 器 套 接 字 ) 端口 是 1574 (或 者 你 可 
能 会 看 到 显示 的 是 一 个 服务 名 mvel-lm) ， 而 我 们 选择 的 端口 是 9734。 
为 什么 会 不 一 样 呢 ? 答案 是 ， 通 过 套 接 字 接 口传 递 的 端口 号 和 地 址 都 
是 二 进 制 数字 。 不 同 的 计算 机 使 用 不 同 的 字 节 序 来 表示 整数 。 例 如 ， 
Intel 处 理 吉 将 32 位 的 整数 分 为 4 个 连续 的 字 节 ， 并 以 字 节 序 1-2-3-4 存 储 
到 内 存 中 ， 这 里 的 1 表示 最 高 位 的 字 广 。 而 IBM PowerPCXb ER ase LAF 
节 序 4-3-2-1 的 方式 来 存储 整数 。 如 果 保 存 整数 的 内 存 只 是 以 逐个 字 节 
的 方式 来 复制 ， 两 个 不 同 的 计算 机 得 到 的 整数 值 就 会 不 一 致 。 

为 了 使 不 同类 型 的 计算 机 可 以 就 通过 网 络 传输 的 多 字 节 整数 的 值 
达成 一 致 ， 你 需要 定义 一 个 网 络 字 节 序 。 客 户 和 服务 器 程序 必须 在 传 
输 之 前 ， 将 它们 的 内 部 整数 表示 方式 转换 为 网 络 字 太 序 。 它 们 通过 定 
义 在 头 文件 netineUin.h 中 的 函数 来 完成 这 一 工作 。 这 些 函 数 如 下 所 示 : 


finclude <netinet/in.h> 


unsigned long int htonl(unsigned long int hostlong); 
unsigned short int htons(unsigned short int hostshort); 
unsigned long int ntohl(unsigned long int netlong); 
unsigned short int ntohs(unsigned short int netshort); 
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间 进 行 转换 。 函 数 名 是 与 之 对 应 的 转换 操作 的 人 简写 形式 。 例 如 “host to 
network, long” (hton1， 长 整数 从 主机 字 节 序 到 网 络 字 节 序 的 转换 ，) 
和 “host to network, short” (htons， 短 整数 从 主机 字 节 序 到 网 络 字 节 序 
的 转换 ) 。 如 果 计 算 机 本 吴 的 主机 字 节 序 与 网 络 字 世 序 相同 ， 这 些 函 
数 的 内 容 实 际 上 职 是 空 操 作 。 

为 了 保证 16 位 的 端口 号 有 正确 的 字 忆 序 ， 你 的 服务 器 和 客户 需要 
用 这 些 函 数 来 转换 端口 地 址 。 新 服务 怖 程序 server3.c 中 的 改动 是 ; 

server address.sin addr.s addr = htonl(INADDR, ANY); 
server address.sin port - htons(9734); 

你 不 需要 对 函数 调用 inet_addr (“127.0.0.1”) 进行 转换 ， 因 为 
inet_addr 已 被 定义 为 产生 一 个 网 络 字 蔬 序 的 结果 。 新 客户 程序 client3.c 
中 的 改动 是 : 

address.sin_port = htons(9734); 


服务 器 也 做 了 改动 ， 通 过 用 INADDR_ANY 来 允许 到 达 服 务 器 任 
一 网 络 接口 的 连接 。 
" 现在 ， 运 行 server3 和 client3 时 ， 你 将 看 到 本 地 连接 使 用 的 是 正确 
|g LI e 


> netstat 
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相同 ， 你 将 不 会 看 到 任何 差异 。 但 为 了 让 不 同体 系 结构 的 计算 机 
上 的 客 尸 和 服务 絮 可 以 正确 地 操作 ， 总 是 在 网 络 程 序 中 使 用 这 些 
转换 函数 仍然 是 非常 重要 的 。 


15.3 SAIR- 


到 目前 为 止 ， 我 们 的 客户 和 服务 器 程序 一 直 是 把 地 址 和 端口 号 编 
译 到 它们 目 己 的 内 部 。 对 于 一 个 更 通用 的 服务 絮 和 客户 程序 来 说 ， 我 
们 可 以 通过 网 络 信息 函数 来 决定 应 该 使 用 的 地 址 和 端口 。 

如 果 你 有 足够 的 权限 ， 也 可 以 将 自己 的 服务 添加 a 到 /etc/services 文 
件 中 的 已 知 服务 列表 中 ， 并 在 这 个 文件 中 为 端口 号 分 配 一 个 名 字 ， 使 
用 户 可 以 使 用 符号 化 的 服务 名 而 不 是 端口 号 的 数字 。 

类 似 地 ， 如 果 给 定 一 个 计算 机 的 名 字 ， 你 可 以 通过 调用 解析 地 址 
的 主机 数据 库 函 数 来 确定 它 的 卫 地 址 。 这 些 函 数 通 过 查询 了 网络 配置 文 
件 来 完成 这 一 工作 ， 如 /etohosts 文 件 或 网 络 信息 服务 。 第 用 的 网 络 信 
息 服 务 有 NIS (Network Information Service， 网 络 信 息 服务 ， 以 前 称 为 
Yellow Pages ， 黄 页 服务 ) 和 DNS (Domain Name Service ， 域 名 服 


主机 数据 库 函 数 在 接口 头 文件 netdb.h 中 声明 ， 如 下 所 示 : 


#include <netdb.h> 


struct hostent *gethostbyaddr(const void “addr, size t len, int type); 
struct hostent *gethostbyname(const char *name); 


这 些 函 数 返 回 的 结构 中 至 少 会 包含 以 下 几 个 成 员 : 
struct hostent ( 

Char *h name; /* name of the host */ 

char **h aliases; /* list of aliases (nicknames) */ 
int h addrtype; /* address type */ 
/ 
/ 


int h length; * length in bytes of the address */ 
char **h_addr list * list of address (network order) */ 


如 果 没 有 与 我 们 查询 的 主机 或 地 址 相关 的 数据 项 ， 这 些 信 息 函 数 
将 返回 一 个 空 指针 。 

类 似 地 ， 与 服务 及 其 关联 端口 号 有 关 的 信息 也 可 以 通过 一 些 服务 
信息 函数 来 获取 。 如 下 所 示 : 


#include <netdb.h> 


N 


struct servent *getservbyname(const char *name, const char *proto); 
struct servent *getservbyport(int port, const char *proto); 


proto 参 数 指定 用 于 连接 该 服务 的 协议 ， 它 的 两 个 取 值 是 tcp 和 
udp ， 前 者 用 于 SOCK_STREAM 类 型 的 TCP 连 接 ， 后 者 用 于 
SOCK_DGRAM 类 型 的 UPD 数 据 报 。 

结构 servent 至 少 包含 以 下 几 个 成 员 : 


struct servent ( 
char *s name; /* name of the service */ 


char **s aliases; /* list of aliases (alternative names) */ 
int 8 port; /* The IP port number */ 
char *8 proto; /* The service type, usually “tcp” or “udp” */ 


如 果 想 获得 某 台 计算 机 的 主机 数据 库 信 息 ， 可 以 调用 
gethostbyname 芳 数 并 且 将 结 采 打印 出 来。 注意 ， 要 把 返回 的 地 址 列表 
转换 为 正确 的 地 址 类 型 ， 并 用 函数 inet_ntoa 将 它们 从 网 络 字 节 友 转换 
为 可 打印 的 字符 串 。 琴 数 inet_ntoa 的 定义 如 下 所 示 : 


#include <arpa/inet.h> 


char *inet ntoa(struct in addr in) 


这 个 函数 的 作用 是 ， 将 一 个 因 符 网 主机 地 址 转换 为 一 个 点 分 四 元 
组 格式 的 字符 串 。 它 在 失败 时 返回 -1， 但 POSIX 规 范 并 未 定义 任何 错 
误 。 其 他 可 用 的 新 函数 还 有 gethostname， 它 的 定义 如 下 所 示 : 


#include <unistd.h> 


int gethostname(char *name, int namelength) ; 


这 个 函数 的 作用 是 ， 将 当前 主机 的 名 字 写 入 name 指 向 的 字符 串 
中 。 主 机 名 将 以 nu 结尾。 参数 namelength 指 定 了 字符 串 name 的 长 度 ， 
如 果 返 回 的 主机 名 太 长 ， 它 丈 会 被 截断 。gethostname 在 成 功 时 返回 
0， 失 败 时 返回 -1， 但 POSIX 规 范 中 没有 定义 任何 错误 。 
实 验 网 络 信息 
下 面 这 个 程序 getname.c 用 来 获取 一 台 主 机 的 有 关 信 息 。 
(1) 与 往常 一 样 ， 包 含 必 要 的 头 文件 并 声明 变量 : 


arpa/inet.t 
nistd.h» 


(2) 把 host 变 量 设置 为 getname 程 序 所 提供 的 命令 行 参数 ， 或 默 
认 设 置 为 用 户主 机 的 主机 名 : 


(3) 调用 gethostbyname， 如 果 未 找到 相应 的 信息 就 报告 一 条 错 


(4) 显示 主机 名 和 它 可 能 有 的 所 有 别名 : 


(5) 如 果 查 询 的 主机 不 是 一 个 IP 主 机 ， 就 发 出 警告 并 退出 : 

if (hostinfo -> h addrtype != AF_INET) ( 
printf(stderr, "not an IP host!\n’); 

exit(1 


(6) 和 否则， 显示 它 的 所 有 卫 地 址 : 


此 外 ， 你 也 可 以 用 gethostbyaddr 函 数 来 查 出 哪个 主机 拥有 给 定 的 
IP 地 址 这 个 函数 来 查找 连接 客户 的 来 源 。 

X 

getname 程 序 通 过 调用 gethostbyname 从 主机 数据 库 中 提取 出 主机 的 
信息 。 它 打印 出 主机 名 、 它 的 别名 (这 台 计 算 机 的 其 他 名 字 ) 和 该 主 
机 在 它 的 网 络 接口 上 使 用 的 IP 地 址 。 运 行 这 个 示例 程序 并 指定 主机 名 
IE 程序 给 出 了 以 太 网 和 调制 解 调 絮 两 个 网 络 接口 的 信息 。 如 下 

ZN: 


$ ./getname tilde 
results for host tilde: 
Name: tilde.localnet 
Aliases: tilde 
192,168.1:1 158.152.x;x 
当 我 们 使 用 主机 名 localhost 时 ， 程 序 只 给 出 了 回路 网 络 的 信息 。 
如 下 所 示 : 
$ ./getname localhost 
results for host localhost: 
Name: localhost 
Aliases 
LAF 9.0.1. 
现在 可 以 改进 我 们 的 客户 程序 ， 使 它 可 以 连接 到 任何 有 名 字 的 主 
机 。 这 次 不 是 连接 到 我 们 的 示例 服务 器 ， 而 是 连接 到 一 个 标准 服务 ， 
这 样 殴 可 以 省 示 端 口号 的 提取 操作 了 。 
大 多 数 UNIX 和 一 些 Linux 系 统 都 有 一 项 标准 服务 daytime， 它 提供 
系统 的 日 期 和 时 间 。 B cl EN ave) 4 Bi A 
期 和 时 间 。 下 面 瓯 是 完成 这 一 工作 的 客户 程序 getdate.c。 


实 验 REN 
(1) 包含 必要 的 头 文件 和 变量 声明 : 


finclude «sys/sccket 
finclude <netine n.h 
' de «netdb.h 

# de <stdio.h 


#include <unistd.h> 


(2) 查找 主机 的 地 址 ， 如 果 找 不 到 ， 就 报告 一 条 错误 : 


hostinfo = gethostbyname(host} ; 
if(thostinfo) { 
fprintf(stderr, ‘no host: ts\n", host); 
exit(1); 


(3) 检查 主机 上 是 否 有 daytime 服 务 : 


servinfo = getservbyname(["'daytime", "'tcp"); 
if(!servinfo) ( 
fprintf(stderr,'no daytime service\n"); 
exit(il: 


printf(*daytime port is d\n", ntohs(servinfo -> s port]); 


(4) 创建 一 个 套 接 字 : 
sockfd = socket (AF_INET, SOCK_STREAM, 0) ; 
(5) 构造 connect 调 用 要 使 用 的 地 址 : 


addregs.sin ramiiy = AFANTI} 
address.sin port = servinfo -» s port; 

address.sin addr = *(struct in_addr *]*hostinfo -> h addr list 
len = sizeof{address); 


(6) 然后 建立 连接 并 取得 有 关 信息 : 


result = connect(sockfd, [struct sockaddr "j&adaress, leny; 
ifiresult == -1] ( 
perror['oops: getdate"); 


exití1); 
) 
resu = readisockfd, buffer, sizeof(buffer) ); 
putter{vesult) = 'A0'; 


printf (*read $d bytes: ts", result, buffer) 


close(sockfd) ; 
exit(0); 


你 可 以 用 getdate 获 取 任 一 已 知 主机 的 日 期 和 时 间 。 


$ ./getdate localhost 

daytime port is 13 

read 26 bytes: 24 JUN 2007 06:03:03 BST 
iM 


P 


如 果 你 看 到 如 下 所 示 的 一 条 错误 信息 : 
oops: getdate: Connection refused 
或 是 : 


oops: getdate: No such file or directory 


X H Bee ALY OR IE E MERA YT LOCA Ja Al daytime 25. ° ThA 
本 的 Linux 系 统 在 默认 情况 下 都 没有 局 用 该 服务 。 在 下 一 节 中 ， 你 将 学 
G- OMNES ERZ ° 


d m 你 可 以 指定 要 连接 的 主机 。daytime 服 务 的 端口 
号 是 通过 网 络 数据 库 函 数 getservbyname 来 确定 的 ， 该 画 数 以 与 返回 主 
机 信息 类 似 的 方法 返回 和 网 络 服务 相关 的 信息 。 程 序 getdate 笑 斌 连接 
到 指定 主机 返回 的 地 址 列表 中 的 第 一 个 地 址 ， 如 果 成 功 ， 它 就 读 取 
daytime 服 务 返回 的 信息 一 一 一 个 表示 UNIX 日 期 和 时 间 的 字符 串 。 


15.3.1 守护 进程 (xinetd/inetd 


UNIX 系 统 通 向 以 超级 服务 器 的 方式 来 提供 多 项 网 络 服务 。 超 级 服 

器 程序 (因特网 守护 进程 xinetd 或 inetd) 同时 监听 许多 端口 地 址 上 的 

。 当 有 客户 连接 到 某 项 服务 时 ， 和 守护 程 序 就 运行 相应 的 服务 句 。 

E LIEU DN dH QNO 它们 可 以 在 需 
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因特网 守护 进程 在 现代 Linux 系 统 中 是 通过 xinetd 来 实现 的 。 
xinetd 实 现 万 式 取代 了 原来 的 UNIX 程 序 inetd， 尽管 你 仍然 会 在 一 
些 较 老 的 Linux 系 统 中 以 及 其 他 的 类 UNIX 系 统 中 看 到 inetd 的 应 
用 。 


我 们 通常 是 通过 一 个 图 形 用 户 
但 我 们 也 可 以 直接 修改 它 的 配置 文件 。 它 的 配置 文件 通 
是 /etc/xinetd.conf 和 /etc/xinetd.d 目 孙 中 的 文件 。 

每 一 个 由 xinetd 提 供 的 服务 都 在 /etc/xinetd.d 目 录 中 有 一 个 对 应 的 配 
reel 。Xinetd 将 在 其 启动 时 或 被 要 求 的 情况 下 读 取 所 有 这 些 配置 文 


下 面 是 一 些 xinetd 配 置 文件 的 例子 ， 首 先是 daytime 服 务 的 配置 : 


protocol 


user 


cT Velo 
FLAGS 


然后 是 文件 传输 服务 的 配置 ; 


我 们 的 getdate 程 序 连 接 的 daytime 服 务实 际 上 束 是 由 xinetd 目 身 负 
责 处 理 的 〈 它 被 标记 为 internal ， 即 内 部 ) ， 它 同时 支持 
SOCK STREAM (tcp) 和 SOCK_DGRAM (udp) 套 接 字 。 

ftp 文 件 传输 服务 只 支持 SOCK_STREAM 套 接 字 ， 并 且 是 由 一 个 外 
部 程序 来 提供 服务 的 。 在 本 例 中 这 个 程序 是 vsftpd， 当 有 客户 连接 到 
ftp 的 端口 时 ， 和 守护 进程 就 会 启动 它 。 

为 了 激活 服务 配置 的 修改 ， 你 需要 编辑 xinetd 的 配置 文件 ， 然 后 发 
送 一 个 挂 起 信号 给 守护 进程 ， 但 我 们 建议 你 使 用 一 种 更 加 友好 的 方式 
来 配置 服务 。 为 了 人 允许 time-of-day 客 户 进行 连接 ， 你 可 以 使 用 Linux 系 
统 提供 的 工具 来 启用 daytime 服 务 。 对 于 SUSE 和 openSUSE 系 统 来 说 ， 
你 可 以 通过 SUSE 控 制 中 心 来 配置 服务 ， 如 图 15-1 所 示 。Red Hat 的 版 
本 (包括 企业 版 Linux 和 Fedora) 也 有 一 个 类 似 的 配置 界面 。 在 图 15-1 
中 ，daytime 服 务 同 时 针对 TCP 和 UDP 查询 进行 了 启用 。 

对 于 使 用 inetd 而 不 是 xinetd 的 系统 来 说 ， 下 面 是 从 inetd 的 配置 文 
件 /etc/inetd.conf 中 提取 的 完成 相同 功能 的 配置 ，inetd 使 用 该 配置 文件 
来 决定 运行 哪些 服务 器 ; 


* 
# «service name» «sock type» «proto» «flags» «user» «server path» «args» 


' 

$ Echo, discard, daytime, and chargen are used primarily for testing. 

' 

daytime scream tcp nowait root internal 

daytime dgram udp wait root internal 

Li 

® These are standard services. 

' 

ftp stream tcp nowalt root /usr/sbin/tcpd /usr/abin/wu. ftpd 
telnet stream tcp nowait root uar/sbín/tcpd /usr/sbin/in.telnetd 


' 
9, Bnd of inetd.conf, 
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usme. 


注意 ， 在 本 例 中 ，ftp 服 务 是 由 外 部 程序 wu.ftpd 提 供 的 。 如 果 你 的 
系统 运行 着 inetd 进 程 ， 你 可 以 通过 编辑 文件 /etc/inetd.conf (一 行 开头 
的 # 号 表示 这 是 一 个 注释 行 ) 再 重新 启动 inetd 进 程 的 方法 来 改变 提供 的 
服务 。 你 可 以 用 k 记 ll 命令 向 inetd 进 程 发 送 一 个 挂 起 信号 来 重启 该 进程 。 
为 了 方便 执行 这 个 操作 ， 有 的 系统 会 配置 成 让 inetd 将 它 的 进程 号 写 入 
一 个 文件 中 。 此 外 ， 你 还 可 以 使 用 killall 命 令 ， 如 下 所 示 : 

# killall -HUP inetd 


15.3.2 选项 


你 可 以 用 许多 选项 来 控制 套 接 字 连接 的 行为 ， 这 些 选 项 的 数目 众 
多 ， 我 们 不 可 能 在 这 里 对 它们 一 一 解释 。setsockopt 范 数 用 于 控制 这 些 
选项 ， 它 的 定义 如 下 所 示 : 
#include «sys/socket.h» 


int setsockopt(int socket, int level, int option_name, 
const void *option value, size t option len); 


你 可 以 在 协议 层次 的 不 同 级 别 对 选项 进行 设置 。 如 果 想 要 在 套 接 
字 级 别 设置 选项 ， 束 必须 将 level 参 数 设 置 为 SOL_SOCKET。 如 有 果 想 要 
在 底层 协议 级 别 (如 TCP、UDP 等 ) 设置 选项 ， 就 必须 将 level 参 数 设 
置 为 该 协议 的 编号 二 (nf A ah aot A XC TE netinet/in.h 或 函数 
getprotobyname 来 获得 ) 。 

option_name 参 数 指定 要 设置 的 选项 ;option_value 参 数 的 长 度 为 
option_len 字 节 ， 它 用 于 设置 选项 的 新 值 ， 它 被 传递 给 底层 协议 的 处 理 
函数 ， 并 且 不 能 被 修改 。 

在 头 文 件 sys/socket.h 中 定义 的 套 接 字 级 别 选 项 ， 如 表 15-5 所 示 。 
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SO_DEBUG #il SO_KEEPALIVE H — T #4 2 BJ option value {Ef 2E i 
置 该 选项 的 开 (1) BK (0) 。SO_LINGER 需 要 使 用 一 个 在 头 文件 
sys/socket.h 中 定义 的 linger 结 构 ， 来 定义 该 选项 的 状态 以 及 套 接 字 关 闭 
之 前 的 拖延 时 间 。 

setsockopt 在 成 功 时 返回 9， 失 败 时 返回 -1。 它 的 手册 页 介绍 了 更 
多 的 选项 和 错误 。 


15.4 多 客户 


到 目前 为 止 ， 本章 一 直 介 绍 的 十 ， 如 何 用 大 接 字 来 实现 本 地 的 和 
PS ZH ARS oe BS o HERE, BRERA AMAR 
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看 到 ， 服 务 需 程序 在 接受 来 目 客户 的 一 个 新 连接 时 ， 会 创建 出 一 个 新 
的 套 接 字 ， 而 原 允 的 监听 套 接 字 将 被 傈 留 以 继续 监听 以 后 的 连接 。 如 
0 
JH o 
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事实 给 我 们 提供 了 一 种 同时 服务 多 个 客户 的 方法 。 如 条 服务 人 磊 调 用 
fork 为 目 己 创建 第 二 份 副本 ,打开 的 套 接 字 束 将 被 新 的 子 进 程 所 继 
承 。 新 的 子 进程 可 以 和 连接 的 客户 进行 通信 ， 而 主 服 务 右 进程 可 以 继 
续 接受 以 后 的 客户 连接 。 这 些 改 动 对 我 们 的 服务 器 程序 来 说 是 非常 容 
易 的 ， 下 面 的 实验 部 分 将 给 出 修改 过 的 服务 器 程 序 。 

因为 我 们 创建 子 进 程 ， 但 并 不 等 每 它们 的 完成 ， 所 以 必须 安排 服 
务 器 忽略 SIGCHLD 信 和 号 以 避免 出 现 僵尸 进程 -2 


Sc 验 可 以 同时 服务 多 个 客户 的 服务 器 

(1) 这 个 程序 server4.c 的 开始 部 分 与 我 们 前 面 的 服务 器 一 脉 相 
承 ， 只 是 增加 了 一 条 包含 signal.h 头 文件 的 include 语句 。 变 量 的 定义 和 
创建 、 命 名 万 接 字 的 过 程 与 以 前 一 样 : 


in.n 


siti 
ent 
er ddres 
e addres 
E REAM 
AF INET; 
1d ir ht: IA A 
-por = htons (973 
server address] 


(2) 创建 一 个 连接 队列 ra 并 程 的 退出 细节 ， 等 待 客户 的 到 


eas 


ient, address) 


= sire 
m ckfd = ac se) server sockf td, 
Ckaddr *J&client address, &client len]; 


(4) 通过 fork 调 用 为 这 个 客户 创建 一 个 子 进程 ， 然 后 测试 你 是 在 
父 进程 中 还 是 在 子 进程 中 ， 
ififorki) - 03-1 


(5) 如 果 你 是 在 子 进 程 中 ， 就 可 以 对 client_sockfd 上 的 客户 执行 
TATE o SEVIS A seit Tani BY: 


nt sockfd, &ch, 1) 


sleep (5) 
writelclient sockfd, &cb, 1); 


(6) 否则 ， 你 一 定 是 在 父 进程 中 ， 你 只 需 关 闭 这 个 客户 : 
else { 


在 处 理 客户 请 求 时 插入 的 5 秒 延迟 是 为 了 模拟 服务 右 的 计算 时 间或 
数据 库 访问 时 间 。 如 果 在 前 面 的 服务 右 中 这 样 做 ，dlient3 的 每 次 运行 
都 将 花费 5 秒 钟 的 时 间 。 而 新 服务 器 可 以 同时 处 理 多 个 dlient3 程 序 ， 所 
化 费 的 总 时 间 将 只 有 5 秒 钟 多 一 点 。 


-/merverd k 


-/elient3 & ./client3 & ./client} & pa x 


实验 解析 

服务 器 程序 现在 将 创建 一 个 新 的 子 进 程 来 处 理 每 个 客户 ， 所 以 你 
将 看 到 好 几 个 服务 器 在 等 待 消息 ， 而 主 进 程 将 继续 等 待 新 的 连接 。ps 
命令 的 输出 (这 里 进行 了 编辑 ) 显示 ，PID 为 26566 的 server4 进 程 正 在 
等 待 新 的 客户 ， 而 3 个 dient3 进 程 正在 由 3 个 服务 器 的 子 进程 进行 服 
务 。 在 经 过 5 秒 的 暂停 后 ， 所 有 的 客户 都 得 到 了 它们 的 结果 并 结束 运 
行 。 服 务 器 的 子 进程 也 都 退出 ， 只 留 下 主 服务 器 进程 在 运行 。 

服务 器 程序 用 fork 函 数 来 处 理 多 个 客户 。 但 在 数据 库 应 用 程序 
中 ， 这 可 能 不 是 最 佳 的 解决 方案 。 因 为 服务 器 程序 可 能 会 相当 大 ， 而 
且 在 数据 库 访 问 方面 还 存在 着 需要 协调 多 个 服务 器 副本 的 问题 。 事 实 
上 ， 我 们 真正 需要 的 是 ， 如 何 让 单个 服务 器 进程 在 不 阻塞 、 不 等 待 
户 请 求 到 达 的 前 提 下 处 理 多 个 客户 。 这 个 问题 的 解决 方案 涉及 如 何 同 
时 处 理 多 个 打开 的 文件 描述 符 ， 并 且 它 不 仅仅 局 限于 套 接 字 应 用 程 
序 ， 请 看 下 一 节 的 select 系 统 调用 。 


在 编写 Linux 应 用 程序 时 ， 我 们 经 常会 遇 到 需要 检查 好 几 个 输入 的 
状态 才能 确定 下 一 步行 动 的 情况 。 例 如 ， 像 终端 仿真 右 这 样 的 通信 程 
序 ， 需 要 有 歼 地 同时 读 取 键 盘 和 串 行 口 。 如 采 是 在 一 个 单 用 户 系 统 
中 ， 运 行 一 个 “ 忙 等 待 ” 循 环 还 是 可 以 接受 的 ， 它 不 停 地 扫描 输入 设备 
iat 数据 ， 如 有 果 有 数据 到 达 就 读 取 它 。 但 这 种 做 法 很 消耗 CPU 的 
Jd IR] o 
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到 达 〈 或 输出 的 完成 ) 。 这 意味 着 终端 仿真 程序 可 以 一 直 阻 塞 到 有 事 
情 可 做 为 止 。 类 似 地 ， 服 务必 也 可 以 通过 同时 在 多 个 打开 的 套 接 字 上 
等 待 请 求 到 来 的 方法 来 处 理 多 个 客户 。 

select 函 数 对 数据 结构 fd_set 进 行 操 作 ， 它 是 由 打开 的 文件 描述 符 
构成 的 集合 。 有 一 组 定义 好 的 宏 可 以 用 来 控制 这 些 集合 : 

#include <sys/types.h> 

#include <sys/time.h> 


void FD ZERO(fd set *fdset); 

void FD CLR(int fd, fd set *fdset); 
void FD SET(int fd, fd set *fdset); 
int FD ISSET(int fd, fd set *fdset); 


顾名思义 ，FD_ZERO 用 于 将 fd_set 初 始 化 为 空 集合 ，FD_SET 和 
FD_CLR 分 别 用 于 在 集合 中 设置 和 清除 由 参数 fd 传递 的 文件 摘 述 符 。 
如 有 果 FD_ISSET 宏 中 由 参数 fd 指 癌 的 文件 描述 符 是 由 参数 fdset 指 癌 的 
fd_set 集 合 中 的 一 个 元 素 ，FD_ISSET 将 返回 非 零 值 。fd_set 结 构 中 可 以 
容纳 的 文件 描述 符 的 最 大 数目 由 常量 FD_SETSIZE 指 定 。 

select 芳 数 还 可 以 用 一 个 超时 值 来 防止 无 限期 的 阻塞 。 这 个 超时 值 
由 一 个 timeval 结 构 给 出 。 这 个 结构 定义 在 头 文 件 sys/time.h 中 ， 它 由 以 
下 几 个 成 员 组 成 : 

struct timeval { 
time t tv sec; /* seconds */ 
long tv usec; /* microseconds */ 


} 
类 型 time_t 文 件 sys/types.h 中 被 定义 为 一 个 整数 类 型 。 
select 系 统 调用 的 原型 如 下 所 示 : 


#include <sys/types.h> 
#include <sys/time.h> 


int select(int nfds, fd set *readfds, fd set *writefds, 
fd set *errorfds, struct timeval *timeout); 


select 调 用 用 于 测试 文件 摘 述 符 集 合 中 ， 是 否 有 一 个 文件 描述 符 已 
处 于 可 读 状 态 或 可 写 状 态 或 错误 状态 ， 它 将 阻塞 以 等 待 某 个 文件 描述 
符 进 入 上 述 这 些 状 态 。 

参数 nfds 指 定 需 要 测试 的 文件 描述 符 数 目 ， 测 试 的 描述 符 范 围 从 0 
。3 个 描述 符 集 合 都 可 以 被 设 为 空 指针 ， 这 表示 不 执行 相应 的 
测试 。 

select 函 数 会 在 发 生 以 下 情况 时 返回 : readfds 集 合 中 有 摘 述 符 可 
读 、writefds 集 合 中 有 拉 述 符 可 写 或 arrorfds 集 合 中 有 摘 述 符 遇 到 销 误 条 
件 。 如 果 这 3 种 情况 都 没有 发 生 ，select 将 在 timeout 指 定 的 超时 时 间 经 
过 后 返回 。 如 果 timeout 参 数 是 一 个 空 指针 并 且 套 接 字 上 也 没有 任何 活 
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读 、 可 写 或 有 错误 的 状态 。 我 们 可 以 用 FD_ISSET 对 描述 符 进 行 测试 ， 
来 找 出 需要 注意 的 摘 述 符 。 你 可 以 修改 timeout 值 来 表明 剩余 的 超时 时 
则 ， 但 这 并 不 是 在 X/Open 规范 中 定义 的 行为 。 如 果 select 是 因为 超时 而 
返回 的 话 ， 所 有 摘 述 符 集合 都 将 被 清空 。 

select 调 用 返回 状态 发 生变 化 的 描述 符 总 数 。 失 败 时 它 将 返回 -1 并 
设置 ermo 来 描述 错误 。 可 能 出 现 的 错误 有 : EBADF (无 效 的 描述 
e ` EINTR 〈 因 中 断 而 返回 ) ^ EINVAL (nfds 或 timeout 取 值 错 
IR d 


虽然 Linux 系 统 会 把 参数 timeout 指 向 的 结构 修改 为 剩余 的 超时 
时 间 ， 但 大 多 数 UNIX 版 本 不 会 这 样 做 。 许 多 现 有 的 使 用 select 画 
数 的 代码 在 初始 化 timeval 结 构 后 ， 就 一 直 使 用 它 而 不 会 重新 初始 
化 它 的 内 容 。 但 这 些 代码 在 Linux 系 统 上 可 能 会 工作 不 正常 ， 因 为 
Linux 会 在 每 次 select 调 用 返回 时 修改 timeval 结 构 。 如 果 你 正在 编 
写 或 移植 使 用 Select 函数 的 代码 ， 就 需要 注意 这 一 区 别 ， 并 且 总 是 
ae ° 注意 ， 这 两 种 行为 都 是 正确 的 ， 但 它们 确实 
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x 验 select 系 统 调用 
下 面 这 个 程序 select.c 演 示 了 select 函 数 的 使 用 方法 。 我 们 稍 后 还 会 
看 到 一 个 更 复杂 的 例子 。 这 个 程序 读 取 键盘 〈 即 标准 输入 一 一 文件 描 


述 符 为 0) ， 超 时 时 间 设 为 2.5 秒 。 它 只 有 在 输入 就 绪 时 才 读 取 键盘 。 
它 可 以 很 容易 地 通过 添加 其 他 描述 符 AUER TER + BL ERF) 
进行 扩展 ， 具 体 做 法 取决 于 应 用 程序 的 需要 。 

(1) 开始 部 分 还 是 与 往常 一 样 ， 包 含 必要 的 头 文件 和 变量 声明 ， 
然后 对 inputs 进 行 初始 化 以 处 理 来 自 键盘 的 输入 : 


eattds 


(2) 在 标准 输入 stdin 上 最 多 等 待 输 入 2.5 秒 : 


(3) 经 过 这 段 时 间 之 后 ， 我 们 对 result 进 行 测试 o 如果 没有 输 
A, 程序 将 再 次 循环 。 如 果 出 现 一 个 错误 ， 程 序 将 退出 运行 : 


(4) 如 果 在 等 待 期 间 ， 你 对 文件 描述 符 采取 了 一 些 动作 ， 程 序 就 
将 读 取 标准 输入 stdin 上 的 输入 ， 并 在 接收 到 行 尾 字 符 后 把 它们 都 回 显 
到 屏幕 上 ， 当 你 输入 的 字符 是 Cul+D 时 ， 就 退出 程序 ; 


运行 这 个 程序 时 ， 它 会 每 隔 2.5 秒 打印 一 个 timeout。 如 果 在 键盘 上 
融入 字符 ， 它 就 会 从 标准 输入 读 取 数据 并 报告 融入 的 内 容 。 对 大 多 数 
shell 来 说 ， 输 入 会 在 用 户 按 下 回 车 刍 或 某 个 控制 序列 时 被 发 送 给 程 
序 ， 所 以 这 个 程序 将 在 你 按 下 回 车 键 时 把 输入 内 容 显 示 出 来 。 注 意 ， 
回 车 键 本 喘 也 像 其 他 字符 一 样 被 读 取 和 处 理 (你 可 以 笑 试 不 按 下 回 车 
键 ， 而 是 在 融入 几 个 字符 后 按 下 组 合 键 Cal+D， 看 看 会 怎么 样 ) 。 


hello 


fred 


实验 解析 

这 个 程序 用 select 调 用 来 检查 标准 输入 的 状态 。 程序 通 过 事先 安排 
的 超时 时 间 每 隔 2.5 秒 打印 一 个 timeout 信 息 ， 这 是 通过 select 调 用 返回 0 
来 判断 的 。 在 文件 的 结尾 ， 标 准 输入 描述 符 被 标记 为 可 读 ， 但 没有 字 
符 可 以 读 取 。 


15.4.2 多 客户 


我 们 的 简单 服务 器 程序 可 以 从 select 调 用 中 获得 益处 ， 通 过 用 
select 调 用 来 同时 处 理 多 个 客户 就 无 需 再 依赖 于 子 进程 了 。 但 在 把 这 个 
技巧 应 用 到 实际 的 应 用 程序 中 时 ， 你 必须 要 注意 ， 不 能 在 处 理 第 一 个 
连接 的 客户 时 让 其 他 客户 等 太 长 的 时 间 。 

服务 器 可 以 让 select 调 用 同时 检查 监听 套 接 字 和 客户 的 连接 套 接 
字 。 一 旦 select 调 用 指示 有 活动 发 生 ， 了 就 可 以 用 FD_ISSET 来 遍历 所 有 
可 能 的 文件 描述 符 ， 以 检查 是 哪个 上 面 有 活动 发 生 。 


如 果 是 监听 套 接 字 可 读 ， 这 说 明正 有 一 个 客户 试图 建立 连接 ， 此 
时 就 可 以 调用 accept 而 不 用 担心 发 生 阻 压 的 可 能 。 如 果 是 某 个 客户 描 
述 符 准备 好 ， 这 说 明 该 描述 符 上 有 一 个 客户 请 求 需 要 我 们 读 取 和 处 
理 。 如 果 读 操作 返回 零 字 世 ， 这 表示 有 一 个 客户 进程 已 结束 ， 你 可 以 
关闭 该 套 接 字 并 把 它 从 描述 符 集 合 中 删除 。 


X 验 一 个 改进 的 多 客户 /服务 器 
(1) 作为 本 章 最 后 一 个 例子 server5.c， 我 们 用 头 文 件 sys/time.h 和 
sys/ioctl.h 蔡 换 掉 上 一 个 程序 中 的 signal.h， 并 且 为 select 调 用 定义 了 一 些 


E, 
变量 : 


(2) 为 服务 器 创建 并 命名 一 个 套 接 字 : 


(3) 创建 一 个 连接 队列 ， 初 始 化 readfds 以 处 理 来 自 server_sockfd 
的 输入 : 


eadi js ! 


mc 不 本 r 
KIG reac 


(4) 现在 开始 等 待 客 户 和 请 求 的 到 来 。 因 为 你 给 timeout 参 数 传 
递 了 一 个 空 指 针 ， 所 以 select 调 用 将 不 会 发 生 超 时 。 如 果 select 调 用 的 
返回 值 小 于 1， 程 序 将 退出 并 报告 出 现 的 错误 : 


for (fd 


查 
f E: 


? Cb) f 
LN j \ 

| A toc FA 
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(6) 如 果 活 动 是 发 生 在 套 接 字 server_sockfd 上 ， 
的 连接 请 求 ， 你 就 把 相关 的 client_sockfd 添 加 到 摘 述 和 


它 肯 
符 集 合 


(7) 如 果 活动 不 是 发 生 在 服务 器 套 接 字 上 ， 那 肯定 是 客户 的 活 
动 。 如 果 接 收 到 的 活动 是 close， 就 说 明 客 户 已 经 离开 ， 你 可 以 把 该 客 
户 的 套 接 字 从 描述 符 集 合 中 删除 。 否 则 ， 束 可 以 像 前 面 的 例子 那样 为 
客户 进行 服务 。 


mr 


在 实际 应 用 的 程序 中 ， 最 好 用 一 个 变量 来 专门 保存 已 连接 套 
接 字 的 最 大 文件 描述 符号 〈 它 不 一 定 是 最 新 连接 的 套 接 字 文 件 描 
述 符 号 ) 。 这 可 以 避免 循环 检查 数 千 个 其 实 并 未 连接 的 套 接 字 ， 
它们 根本 不 可 能 处 于 可 读 状 态 。 出 于 简洁 和 让 代码 易于 理解 的 目 
的 ， 我 们 在 这 里 没有 这 样 做 。 


运行 服务 器 的 这 个 版 本 时 ， 它 将 在 一 个 进程 中 对 多 个 客户 依次 进 
(TAPER e 


/server5 & 


./client3 & ./client3J & ./client3 k ps 


为 了 让 本 草 开头 的 类 比 更 完整 ， 表 15-6 对 套 接 字 连 接 和 电话 接 入 
进行 了 对 比 。 


X 15-6 
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15.5 “数据 报 


在 本 章 中 ， 我 们 重点 介绍 了 如 何 编写 与 客户 之 间 维 持 连 接 的 应 用 
程序 。 我 们 用 面向 连接 的 TCP 套 接 字 来 完成 这 一 工作 。 但 在 有 些 情况 
下 ， 在 程序 中 花费 时 间 来 建立 和 维持 一 个 套 接 字 连接 是 不 必要 的 。 

早先 ， 我 们 在 程序 getdate.c 中 所 使 用 的 daytime 服 务 束 是 一 个 很 好 
的 例子 。 我 们 首先 创建 一 个 套 接 字 ， 然 后 建立 连接 ， 读 取 一 个 啊 应 ， 
最 后 关闭 连接 。 在 这 一 过 程 中 ， 我 们 使 用 了 很 多 操作 步骤 ， 仅 仅 为 了 
获取 一 个 日 期 。 

daytime 服 务 还 可 以 用 数据 报 通过 UDP 来 访问 。 为 了 访问 它 ， 发 送 
一 个 数据 报 给 该 服务 ， 然 后 在 响应 中 获取 一 个 包含 日 期 和 时 间 的 数据 
报 。 这 一 过 程 非常 简单 。 

当 客户 需要 发 送 一 个 短小 的 查询 请 求 给 服务 器 ， 并 且 期 望 接 收 到 
一 个 短小 的 响应 时 ， 我 们 一 般 就 使 用 由 UDP 提 供 的 服务 。 如 果 服 务 器 
处 理 客 户 请 求 的 时 间 足 够 短 ， 服 务 器 就 可 以 通过 一 次 处 理 一 个 客户 请 
求 的 方式 来 提供 服务 ， 从 而 允许 操作 系统 将 客户 进入 的 请 求 放 入 队 
列 。 这 简化 了 服务 器 程序 的 编写 。 

因为 UDP 提供 的 是 不 可 靠 服 务 ， 所 以 你 可 能 发 现 数据 报 或 啊 应 会 
丢失 。 如 果 数 据 对 于 你 来 说 非常 重要 ， 就 需要 小 心 编写 UDP 客户 程 
En 。 实际 上 ，UDP 数 据 报 在 局 域 网 中 是 

党 可 靠 的 。 

为 了 访问 由 UDP 提供 的 服务 ， 你 需要 像 以 前 一 样 使 用 套 接 字 和 
close 系 统 调 用 ， 但 你 需要 用 两 个 数据 报 专 用 的 系统 调用 sendto 和 
recvfrom 来 代替 原来 使 用 在 套 接 字 上 的 read 和 write 调用 。 

下 面 是 一 个 修改 过 的 getdate.c 版 本 ， 它 通过 UDP 数据 报 服务 来 获 
取 数 据 。 对 先前 版 本 的 改动 将 以 阴影 显示 。 


如 你 所 见 ， 需 要 改动 的 地 方 非常 少 。 像 以 前 一 样 ， 我 们 用 
getservbyname 来 查找 daytime 服 务 ， 但 通过 请 求 UDP 协议 来 指定 数据 报 
服务 。 我 们 使 用 市 有 SOCK_DGRAM 参 数 的 socket 调 用 来 创建 一 个 数据 


报 套 接 字 。 我 们 还 是 采用 与 以 前 一 样 的 方式 来 构建 目标 地 址 ， 但 现在 
需要 发 送 一 个 数据 报 而 不 是 仅仅 从 套 接 字 上 读 取 数据 。 

因为 我 们 并 没有 明确 地 建立 一 条 到 指定 UDP 服务 的 连接 ， 所 以 必 
须 用 茶 些 方式 让 服务 器 知道 你 需要 接收 一 个 啊 应 。 在 本 例 中 ， 给 服务 

a IR PRR (在 这 里 ， 从 准备 接收 啊 应 的 缓存 区 中 发 送 一 个 字 

节 的 数据 ) ， 它 返回 包含 日 期 和 时 间 的 响应 。 

sendto 系 统 调 用 从 buffer 缕 存 区 中 给 使 用 指定 套 接 字 地 址 的 目标 服 

铝 发 送 一 个 数据 报 。 它 的 原型 如 下 所 示 : 


int sendto(int sockfd, void *buffer, size_t len, int flags, 
struct sockaddr *to, socklen t tolen); 


在 正常 应 用 中 ，flags 参 数 一 般 被 设置 为 0。 
recvfrom 系 统 调用 在 套 接 字 上 等 每 从 特定 地 址 到 来 的 数据 报 ， 并 
将 它 放 入 buffer 缓 存 区 。 它 的 原型 如 下 所 示 : 


int recvfrom(int sockfd, void *buffer, size_t len, int flags, 
struct sockaddr *from, socklen_t *fromlen); 


同样 ， 在 正常 应 用 中 ，flags 参 数 一 般 被 设置 为 0。 
为 了 让 示例 程序 变 得 人 简短， 我 们 省 略 了 错误 处 理 。 当 错误 发 生 
时 ，sendto 和 recvfrom 都 将 返回 -1 并 设置 errno。 可 能 的 错误 见 表 15-7 ° 


表 15-7 


除非 用 fcnt1 将 套 接 字 设 置 为 非 阻塞 方式 “正如 在 前 面 的 接受 TCP 
连接 中 看 到 的 那样 ) ， 否 则 recvfrom 调 用 将 一 直 阻 塞 。 我 们 可 以 用 与 
前 面 的 面 回 连接 服务 万 一 样 的 方式 ， 通 过 select 调 用 和 超时 设置 来 判断 
是 否 有 数据 到 达 套 接 字 。 此 外 ， 还 可 以 用 alarm 时 钟 信 号 来 中 断 一 个 接 
收 操作 (参见 第 11 章 ) 。 


15.6 小结 


在 本 章 中 ， 我 们 介绍 了 另 一 种 进程 间 通 信 的 方法 : 套 接 字 。 通 过 
它 可 以 开发 出 真正 可 以 跨 网 络 运 行 的 分 布 式 客户 /服务 器 应 用 程序 。 我 
们 简要 介绍 了 一 些 主机 数据 库 信 息 函 数 以 及 Linux 是 如 何 使 用 因特网 守 
护 进 程 来 处 理 标 准 系统 服务 的 。 我 们 开发 了 几 个 客户 /服务 右 示 例 程 序 
来 演示 网 络 和 多 客户 处 理 方法 。 

最 后 ， 我 们 介绍 了 select 系 统 调 用 ， 它 允许 一 个 程序 同时 在 多 个 打 
开 的 文件 描述 符 和 矢 接 字 上 等 竺 输入 和 输出 活动 的 发 生 。 


U 原 书 的 说 明 似 有 误 ， 例 如 对 于 TCP 协 议 ， 我 们 可 以 将 level 参 数 设置 
JJIPPROTO TCP ° ——i# yt 

-上 原 书 似 有 误 ， 要 避免 出 现 僵尸 进程 ， 就 必须 在 服务 器 中 设置 
SIGCHLD 的 信号 处 理 函 数 。 一 一 译 者 注 


第 16 章 ”用 GTK+ 进 行 GNOME 编 程 


在 未 书 前 面 的 部 分 中 我 们 介绍 了 Linux 程 序 设计 中 与 复杂 的 底 
层 问题 相关 的 主题 。 现 在 ， 我 们 将 为 应 用 程序 中 增添 一 些 活力 ， 介 绍 
如 何在 应 用 程序 中 加 入 图 形 用 户 界面 (GUI) 。 在 本 章 和 下 一 章 中 ， 
我 们 将 介绍 Linux 中 两 个 最 受 欢 迎 的 GUI 库 : GTK+ 和 KDE/Qt。 这 两 个 
库 对 应 两 个 最 受 欢 迎 的 Linux 桌 面 环境 : GNOME (GTK+) 和 KDE ° 
Linux 中 所 有 的 GUI 库 都 基于 被 称 作 X 视 窗 系 统 (更 常见 的 称呼 是 
X11 或 者 X) 的 底层 视窗 系统 。 因 此 ， 在 讲述 GNOME/GTK+ 的 具体 细 
节 之 前 ， 我 们 将 首先 简要 介绍 X 视 窗 系统 是 如 何 运行 的 ， 并 帮助 读者 
理解 该 视窗 系统 的 不 同 层次 是 如 何 相 互 配 合 从 而 创建 桌面 的 。 
本 章 将 涵盖 以 下 内 容 : 
XIA RA 
GNOME/GTK+ 简 介 
GTK+ 构 件 
GNOME 构 件 和 菜单 
对 话 框 
用 GNOME/GTK+ 编 写 CD 数据 库 GUI 
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16.1 XHA AHM 


如 果 你 曾经 在 Linux 中 使 用 过 桌面 视窗 系统 ， 那 么 你 很 可 能 使 用 的 
是 X 一 一 一 个 开源 图 形 化 系统 。X 的 一 个 最 富有 创新 性 也 最 令 人 感到 泪 
来 的 特征 ， 是 它 固 守 机 制 的 要 求 ， 而 不 是 策略 的 需要 。 它 没有 定义 用 
户 界面 ， 但 提供 了 创建 用 户 界 面 的 手段 。 这 意味 着 你 可 以 自由 地 创建 
自己 的 整个 桌面 环境 ， 随 意 进行 试验 和 创新 。 但 它 也 在 很 长 一 段 时 间 
内 妨碍 了 Linux 和 UNIX 系 统 上 用 户 界面 的 发 展 。 在 这 一 片 相对 空白 的 
领域 中 ， 两 个 桌面 项 目 逐 渐 浮 现成 为 Linux 用 户 的 最 爱 : GNOME 和 
KDE。 然 而 ，Linux 桌 面 并 不 始 于 X， 也 不 终于 X。 事 实 上 ，Linux 中 的 
桌面 是 一 个 相当 模糊 的 东西 ， 并 没有 哪个 项 目 或 是 组 织 在 发 布 的 权威 
了 大 量 的 库 、 工 具 和 应 用 程序 ， 它 们 被 总 
尔 为 “ m 

X 拥 有 悠久 而 辉煌 的 历史 ， 它 最 初 于 20 世 纪 80 年 代 早期 由 MIT 开 
发 。X 为 当时 的 高 端 科 学 工作 站 提供 一 个 统一 的 视窗 系统 ， 那 些 工 作 
站 都 是 非常 昂贵 的 、 用 于 复杂 计算 的 庞然大物 。 

20 世 纪 90 年 代 ， 随 着 硬件 价格 的 下 降 ， 一 些 爱 好 者 将 X 移 植 到 廉 
价 的 家 用 PC 上 ， 这 个 项 目 后 来 被 称 为 XFree86 (Intel 和 其 他 公司 生产 
的 PC 处 理 絮 被 称 为 x86 处 理 絮 ) 。 目 前 在 Linux 上 发 布 的 都 是 XFree86 
PEE 大 多 数 Linux 发 行 版 使 用 的 是 一 个 被 称 为 X.Org 的 X 变 


X 视 窗 系统 被 分 为 硬件 级 和 应 用 程序 级 组 件 ， 它 们 分 别 被 称 为 X 服 
务 嚣 和 X 客 户 问 。 这 些 组 件 使 用 X 协 议 进 行 通信 。 在 下 面 几 市 中 ， 我 们 
将 依次 介绍 它们 。 


16.11 XX 服务 器 


X 服 务 器 运行 在 用 户 的 本 地 机 器 上 ， 它 在 屏幕 上 完成 低层 的 绘图 
操作 。 其 名 字 中 的 服务 器 部 分 经 常 让 人 困惑 : XARB ABATE ARPA 
泉 面 PC 上 ， 而 X 客 户 端 既 可 以 运行 在 用 户 的 桌面 PC 上 ， 也 可 以 运行 在 
网 络 中 的 其 他 系统 (包括 服务 器 ) 上 。 这 一 颠倒 的 术语 只 有 在 你 理解 
它 时 才 有 音义， 但 它 通常 看 上 去 有 点 反 其 道 而 行 之 的 感觉 。 

因为 X 服 务 器 直接 与 显卡 交互 ， 所 以 你 必须 使 用 一 个 适合 本 机 显 
卡 的 X 服 务 右 ， 并 配置 好 合适 的 分 辨 率 、 刷 新 率 、 颜 色 深 度 等 。 其 配 
置 文件 名 是 xorg.conf 或 者 Xfree86Config。 在 过 去 ， 你 通常 需要 手动 编 


EAC Be CPT Be e XIE S LIF o SIAM, SEA Linux A 11h Ay LA 
eee 这 节省 了 用 户 的 时 间 ， 也 解决 了 很 多 让 人 头疼 
[A 题 o 
又 服务 右 通 过 鼠标 和 键盘 监听 用 户 输入 ， 并 将 键盘 按键 和 鼠标 点 
击 传输 给 X 客 户 端 应 用 程序 。 这 些 信息 被 称 为 事件 (event) ， 它 们 构 
成 GUI 编程 的 一 个 关键 元 素 。 我 们 将 在 本 章 后 面 详细 介绍 事件 及 其 
GTK+ 逻 辑 扩展 信号 (signal) 。 


16.1.2 XE Pm 


X 客 户 端 是 以 X 视 窗 系 统 作 为 GUI 的 任何 程序 。 例 如 xterm ` xcalc 
和 类 似 Abiword 的 更 高 级 的 应 用 程序 。 通 常情 况 下 ，X 客 户 端 等 候 X 服 
务 咒 传送 的 用 户 事 件 ， 然 后 通过 给 X 服 务 器 发 送 重 绘 消 息 来 啊 应 。 


X 客 户 端 不 需要 和 X 服 务 融和 运行 在 同一 全 机 希 上 。 


16.1.3 义 协议 


X 客 户 问 和 X 服 务 右 使 用 协议 进行 通信 ， 这 使 得 客户 端 和 服务 大 

可 以 通过 网 络 分 离 。 例 如 ， 你 可 以 在 因特网 或 者 加 密 的 虚拟 专用 网 

(VPN) 上 的 一 台 远 程 计算 机 上 运行 X 客 户 端 应 用 程序 。 对 于 绝 大 多 
数 个 人 Linux 系 统 来 说，X 客 户 端 和 X 服 务 硕 都 运行 在 同一 个 系统 


16.1.4 Xlib 麻 


Xlib 是 X 客 户 端 间接 用 于 产生 X 协 议 消 息 的 库 。 它 提供 一 个 非常 底 
层 的 API 供 客户 端 在 X 服 务 器 上 绘制 非常 基本 的 元 素 ， 并 响应 最 简单 的 
输入 。 我 们 必须 强调 ，Xlib 是 一 个 非常 底层 的 库 ， 即 使 使 用 Xlib 库 创 
建 一 个 像 菜单 这 样 非常 简单 的 东西 ， 也 要 耗费 程序 员 很 大 的 精力 ， 它 
需要 数 百 行 的 代码 。 

GUI 程 序 员 不 应 该 直接 使 用 Xlib 进 行 编程 。 你 需要 一 个 API 使 得 诸 
如 菜单 、 按 钮 和 下 拉 式 列表 等 GUI 元 素 能 够 被 简单 方便 地 创建 。 简 而 
言 之 ， 这 就 是 X 工 具 包 的 作用 。 


16.1.5 义工 具 包 


X 工 具 包 是 一 个 GUI 库 ，X 客 户 端 可 以 利用 它 来 极 大 地 简化 窗口 、 
某 单 和 按钮 等 的 创建 。 使 用 工具 包 ， 你 通过 一 次 函数 调用 就 可 以 创建 
按钮 、 菜 单 、 框 锋 等 类 似 的 元 素 。 诸 如 此 类 的 GUI 元 素 补 统称 为 构件 
(widget) ， 你 在 所 有 的 现代 GUI 库 中 都 能 找到 这 个 通用 术语 。 

你 有 几 十 个 X 工 具 包 可 选 ， 每 个 工具 包 都 有 其 长 处 和 短处 。 选 择 
a a 
NA E 

O “应 用 程序 针对 的 用 户 是 谁 ? 

Oo 用 户 是 否 已 经 安装 好 了 工具 包 库 ? 

o 该 工具 包 是 否 支 持 其 他 流行 的 操作 系统 ? 

ee ee 

法 一 致 ? 

口 “ 该 工具 包 是 否 文 持 你 的 编程 语言 ? 

口 “ 该 工具 包 是 否 具 有 现代 的 界面 外 观 ? 

历史 上 最 流行 的 工具 包 有 Motif、OpenLook 和 Xt， 但 是 它们 大 多 
已 经 被 技术 上 更 先进 的 GTK+ 和 Qt 工具 包 所 取代 ， 这 两 者 分 别 构成 了 
GNOME 和 KDE 桌 面 的 基础 。 


16.1.6 口 管理 


X 中 最 后 一 个 部 分 就 是 窗口 管理 器 ， 它 负责 定位 屏幕 上 的 窗口 。 
窗口 管理 器 通常 支持 独立 的 “工作 区 *， 这 些 工作 区 将 桌面 分 割 ， 增 大 
用 户 可 以 交互 的 区 域 。 窗 口 管 理 器 还 负责 装饰 每 个 窗口 ， 通 常 这 些 装 
饰 由 一 个 框架 和 一 个 这 有 最 大 化 、 最 小 化 和 关闭 图 标的 标题 栏 组 成 。 
窗口 管理 器 提 供 了 桌面 的 部 分 界面 外 观 ， 例 如 窗口 标题 栏 。 

常见 的 窗口 管理 器 包括 下 面 儿 个 。 

O Metacity: GNOME 桌 面 的 默认 窗口 管理 器 。 

O KWin: KDE 桌面 的 默认 窗口 管理 颖 。 

O Openbox: 旨 在 节约 资源 ， 用 于 较 老 的 、 较 慢 的 系统 。 

O Enlightenment: 一 个 有 着 出 色 图 形 和 效果 的 窗口 管理 器 。 

就 和 X 中 的 一 切 一 样 ， 你 也 可 以 切换 窗口 管理 器。 但 大 多 数 用 户 
都 使 用 扣 面 环境 自 带 的 窗口 管理 器 。 


16.1.7 ”创建 GUI 法 一 平台 Ji L1 
API 


其 他 一 些 不 是 特定 于 Linux 的 创建 GUI 的 方法 也 是 值得 一 提 的 。 有 
些 语言 本 身 就 广 持 GUI， 并 且 可 以 在 Linux 下 使 用 。 
口 、Java 语 言 使 用 Swing 和 较 老 的 AWT API 来 支持 创建 GUI ° Java 
GUI 的 界面 外 观 并 不 是 所 有 人 都 喜欢 ， 而 且 在 配置 低 的 机 器 上 ， 
它 的 界面 感觉 比较 策 抽 ， 而 且 响 应 迟钝 。 使 用 Java 的 一 大 好 处 
是 ， 编 译 好 的 Java 代 码 可 以 在 任何 具有 Java 虚 拟 机 的 平台 (包括 
Linux ^ Windows ^ Mac OS 以 及 移动 设备 ) 上 运行 而 无 需 任何 改 
动 。 更 多 信息 请 访问 http:Wjava.sun.com。 
Oo C# 是 一 个 与 Java 非 常 类 似 的 编程 语言 。Linux 系 统 需 要 安装 来 
自 Mono 项 目 (http://www.mono-project.com) 的 C# 公 共 语 言 运行 
时 环境 (CLR) 。Mono 平 台 上 的 C# 不 支持 Windows Forms (È tE 
B I QM ， 以 及 一 个 被 称 为 Gtk# 的 对 GTK+ 工 具 包 的 特 
殊 绑 定 。 
D TcVTk 是 一 个 脚本 语言 ， 它 非常 适 于 快速 开发 GUI， 并 文 持 
X、Windows 和 Mac OS。 当 需要 快速 原型 开发 ， 或 开发 一 些小 工 
具 (需要 脚本 的 简单 性 和 可 维护 性 ) T, Tek Tki E o AKZ 
语言 的 更 详细 资料 请 见 http://td.tk。 
口 _ Python 也 是 一 个 脚本 语言 。 你 可 以 在 Python 中 使 用 TcyTk 的 Tk 
部 分 ， 或 使 用 Python 的 GTK+ 绑 定 来 编写 GTK+ 程 序 。 有 关 该 语言 
的 更 多 资料 请 见 http:/www.python.org ° 
口 ”Pell 是 男 一 个 常见 的 Linux 肢 本 语言 。 你 可 以 在 Perl 中 使 用 
Tc/Tk 的 Tk 部 分 ， 这 被 称 为 PerV/Tk。 有 关 Perl 的 更 多 资料 请 见 
http://www.perl.org/ ° 
这 些 语 言 市 来 的 平台 无 关 特 性 是 需要 付出 代价 的 。 与 本 地 应 用 程 
序 之 间 共 享 信息 〈 例 如 使 用 “ 拖 放 ”技术 ) 会 比较 困难 ， 而 且 保存 配置 
通常 必须 使 用 专用 方法 而 非 桌面 标准 方法 。 有 时 Java 软 件 的 销售 商 通 
过 附带 平台 相关 的 扩展 来 回避 这 些 问题 。 


16.2 ”GTK+ 人 简介 


了 解 了 X 视 窗 系统 之 后 ， 下 面 我 们 该 介绍 GTK+ 工 具 包 了 ° 
GTK+ 一 开始 是 作为 流行 的 GNU 图 像 处 理 程序 GIMP 的 一 部 分 产生 的 ， 
这 也 是 GTK 得 名 的 原因 (Gimp ToolKit 的 缩写 ) 。 因 为 GTK+ 已 经 发 展 
并 逐渐 成 为 功能 最 强大 和 最 受 欢 迎 的 工具 包 之 一 ， 所 以 GIMP 程 序 设计 
者 硕 有 远见 地 将 GTK+ 变 为 一 个 独立 的 项 目 。GTK+ 项 目的 主页 是 
http://www. gtk.org ° 


简 而 言 之 ，GTK+ 是 一 个 函数 库 ， 它 提供 了 一 组 已 制作 好 的 
被 称 为 构件 的 组 件 。 你 通过 简单 易 用 的 函数 调用 把 这 些 组 件 和 应 
用 程序 逻辑 组 合 在 一 起 ， 从 而 极 大 地 简化 了 GUI 的 创建 。 


尽管 GTK+ 是 一 个 与 GIMP 一 样 的 GNU 项 目 ， 但 是 它 使 用 的 是 更 自 
由 的 LGPL 许 可 证 (Lesser GeneralPublic License) 。LGPL 人 允许 人 们 使 
用 GTK+ 来 编写 软件 (包括 源 代 码 不 开放 的 私有 软件 ) 而 不 用 支付 任 
何 使 用 费 、 版 税 及 受到 其 他 限制 。GTK+ 许 可 证 所 提供 的 自由 度 与 它 
的 竞争 者 Qt (下 一 章 的 主题 ) 恰 成 对 比 ， 后 者 的 GPL 许可 证 禁止 使 用 
Qt 开发 商业 软件 (你 必须 购买 一 个 商业 Qt 许可 证 ) 。 

GTK+ 完 全 是 用 C 语 言 编 写 的 ， 而 且 绝 大 多 数 GTK+ 软 件 也 是 用 C 
语言 编写 的 。 但 幸运 的 是 ， 有 许多 语言 绑 定 使 你 可 以 在 自己 偏好 的 语 
言 中 使 用 GTK+， 这 些 语言 包括 C++、Python、PHP、Ruby、Perl ^ C£ 
和 Java ° 

GTK+ 本 身 是 建立 在 一 组 其 他 函数 麻 之 上 的 ， 如 下 所 示 。 

sj 2 提供 底层 数据 结构 、 类 型 、 线 程 支持 、 事 件 循 环 和 动 

WON IES 7 

nj GObject: 使 用 C 语 言 而 不 是 C++ 语言 实现 了 一 个 面向 对 象 系 

O Pango: XERE RAME ° 

O ATK: 用 来 创建 可 访问 应 用 程序 ， 并 人 允许 用 户 使 用 屏幕 阅读 

如 和 其 他 协助 工具 来 运行 你 的 应 用 程序 。 

O GDK (GIMP 绘 图 工具 包 ) : 在 Xlib 之 上 处 理 底层 图 形 演 染 。 

O GdkPixbuf: 在 GTK+ 程 序 中 帮助 处 理 图 像 。 

O Xlib: 在 Linux 和 UNIX 系 统 上 提供 底层 图 形 。 


16.2.1 ”GLib 类 型 系统 


如 果 你 阅读 过 GTK+ 代 码 ， 你 可 能 会 很 奇怪 为 什么 代码 中 有 许多 
以 字母 g 开 头 的 C 语 言 数 据 类 型 ， 如 gint、gchar、gshort， 还 有 一 些 像 
gint32 和 gpointer 这 样 不 熟悉 的 类 型 。 这 是 因为 GTK+ 建 立 在 一 个 可 移植 
pele 它们 定义 了 这 些 类 型 来 实现 跨 平台 开 


Glib 和 GObject 提 供 了 一 组 数据 类 型 、 芳 数 和 宏 的 标准 蔡 代 集 来 进 
行内 存 管理 和 处 理 常见 任务 ， 从 而 实现 跨 平 台 开 发 。 这 些 数 据 类 型 、 
函数 和 安 意味 着 作为 GTK+ 程 序 员 ， 我 们 可 以 确信 我 们 的 代码 能 可 靠 
地 移植 到 其 他 平台 和 体系 结构 上 。 

Glib 还 定义 了 一 些 方 便 的 常量 : 

#include <glib/gmacros.h> 


#define FALSE 0 
#define TRUE !FALSE 


这 些 附加 的 数据 类 型 基本 上 是 标准 C 语 言 数 据 类 型 的 替代 (为 了 
一 致 性 和 可 读 性 ) ， 以 及 用 于 确保 跨 平台 字 市 长 度 不 变 。 

O gint^ guint ^ gchar ` guchar ` glong ^ gulong ^ gfloat 和 gdouble 

是 标准 C 语 言 数据 类 型 的 简单 替代 (为 一 致 性 考虑 ) 。 

O gpointer 与 (void *) 同 义 。 

[1 gboolean 用 于 表示 布尔 类 型 的 值 ， 它 是 对 int 的 一 个 包 厂 。 

O gint8 ^ guint8 ` gintl6 ^ guintl6 、gint32 和 guint32 是 保证 字 节 长 

度 的 有 符号 和 无 符号 类 型 。 

使 用 Glib 和 GObject 几 乎 是 透明 的 ， 这 一 点 很 有 用 。Glib Æ 
GTK+ 中 被 广泛 地 使 用 ， 因 此 ， 如 果 你 有 一 个 可 以 正常 工作 的 GTK+， 
你 将 发 现 GLib 也 被 安装 了 。 在 使 用 GTK+ 编 程 时 ， 你 其 至 不 需要 明确 
地 包含 头 文件 glib.h， 这 一 点 你 将 在 本 革 后 面 看 到 。 


16.2.2 GTK+XA ARS 


编 过 GUI 程序 的 人 都 能 理解 ， 我 们 为 什么 说 GUI 库 非 常 适合 于 使 
用 面向 对 象 编程 的 范 型 ， 以 至 于 所 有 的 现代 工具 包 (包括 GTK+) 都 
是 以 一 种 面向 对 象 的 风格 编写 的 。 

尽管 GTK+ 是 完全 用 C 语 言 编写 的 ， 但 是 它 通 过 GObject 库 支持 对 
象 和 面向 对 象 编程 。 这 个 库 通 过 宏 来 支持 对 象 继 承 和 多 态 。 


让 我 们 看 一 个 继承 和 多 态 的 例子 ， 它 取 自 GTK+API 文 档 中 的 
GtkWindow 的 对 象 层次 结构 : 


这 个 对 象 列表 表明 GtkWindow 是 GtkBin 的 一 个 子 类 ， 因 此 所 有 带 
GtkBin 参 数 的 函数 在 调用 时 都 可 以 这 GtkWindow 参 数 。 同 样 地 ， 
GtkBin 继 承 自 GtkContainer， 而 后 者 继承 自 GtkWidget ° 

为 方便 起 见 ， 所 有 构件 创建 钞 数 都 返回 一 个 GtkWidget 的 类 型 。 例 
如 : 

GtkWidget* gtk window new (GtkWindowType type); 

假设 你 创建 了 一 个 GtkWindow， 并 想 把 返回 值 传 给 某 个 需要 以 
GtkContainer 作 为 参数 的 函数 (如 gtk_container_add) : 
void gtk container add (GtkContainer *container, GtkWidget *widget); 

_ 你 需要 使 用 宏 GTK_CONTAINER 在 GtkWidget 和 GtkContainer 之 间 
进行 类 型 转换 ; 


wy K GTR WINI 


TLE HIER SCE BONUS EF. 。 现 在 你 只 需 知道 宏 是 经 常 被 使 用 
的 ， 每 一 种 可 能 的 类 型 转换 都 有 对 应 的 宏 存在 。 


如 果 你 还 不 是 很 清楚 ， 请 不 要 担心 。 掌 握 GNOME/GTK+ 并 
不 需要 你 理解 面向 对 象 编 程 的 所 有 细节 。 事 实 上 ， 利 用 C 语 言 的 
知识 背景 就 可 以 让 你 轻松 学 习 面 向 对 象 编程 思想 和 其 优点 。 


16.2.3 GNOME 简介 


GNOME 是 一 项 1997 年 局 动 的 项 目的 名 称 ， 该 项 目 由 GIMP 程 序 员 
发 起 ， 目 标 是 为 Linux 创 建 一 个 统一 的 桌面 。 人 们 有 一 个 普遍 的 共识 : 
缺乏 一 个 一 任 的 案 略 阻碍 了 Linux 用 作 桌 面 平 台 的 进程 。 那 时 ，Linux 
桌面 就 像 拓 殉 前 的 美国 西部 一 样 ， 没 有 整体 的 标准 和 约定 的 做 法 ， 却 
有 “无 所 不 为 ”的 程序 员 精 神 。 由 于 没有 一 个 权威 组 织 对 桌面 菜单 、 一 
致 的 界面 外 观 、 文 档 、 翻 译 等 进行 控制 ， 所 以 说 好 听 点 ， Linux 
的 新 手 会 感到 很 迷惑 ， 说 难听 上 点， 这样 的 桌面 根本 无 法 使 用 。 


GNOME 团 队 着 手 创 建 一 个 完全 遵循 GPL 许可 证 的 Linux 桌 面 ， 用 
统一 和 一 致 的 风格 来 开发 工具 和 配置 程序 ， 同 时 促进 程序 间 通 信 、 打 
印 、 会 话 管理 、GUI 程 序 设计 最 佳 实践 等 方面 标准 的 制定 。 

他 们 努力 的 结果 是 显而易见 的 一 一 现在 GNOME 已 成 为 Fedora、 
2s P Ubuntu 以 及 openSUSE 等 发 行 版 的 默认 Linux 桌 面 的 基础 ( 见 
16-1) œ 
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GNOME 最 初代 表 的 是 GNU Network Object Model Environment 
(GNU 网 络 对 象 模 型 环境 ) ， 这 反映 了 GNOME 早 期 的 一 个 目标 ， 即 
为 Linux 引 入 一 个 像 Microsoft OLE& 一 样 的 对 象 框架 ， 这 样 你 就 可 以 在 
字 处 理 文档 中 骨 入 电子 表格 了 。 现 在，GNOME 的 设计 目标 发 生 了 变 
化 ， 我 们 所 知道 的 GNOME 指 的 是 整个 代 面 环境 ， 它 包括 一 个 启动 应 
用 程序 的 面板 、 一 父 程 序 和 实用 工具 、 编 程 库 以 及 开发 着 文 持 特性 。 
在 开始 编程 之 前 ， 你 需要 确认 所 有 库 都 已 安装 好 o 


16.2.4 AGNOME/GTK- 
一 个 带 有 标准 应 用 程序 和 GNOME/GTK+ 开 发 库 的 完整 GNOME 桌 


面包 括 60 多 个 软件 包 。 因 此 ， 从 头 安 故 GNOME ,无论 是 手工 安 痛 还 是 
从 源 代 码 安装 ， 都 是 一 个 令 人 蝴 惧 的 过 程 。 幸 运 的 是 ， 现 代 Linux 发 行 


版 都 有 很 优秀 的 软件 包 管 理工 具 ， 它 使 得 安装 GNOME/GTK+ 及 其 开 
发 库 变 得 轻而易举 。 

在 Red Hat 与 Fedora Linux 中 ， 你 通过 点 击 应 用 程序 菜单 按钮 (在 
左上 角 ) ,并 选择 Add/Remove Software (增加 /删除 软件 ) 来 打开 软件 
包 管 理工 具 。 软 件 包 管理 工具 打开 后 ( 见 图 16-2) ,请 确认 GNOME 
Software Development (GNOME 软 件 开发 ) 检查 框 被 选中 。 它 在 
Development (开发 ) 区 域 中 。 


本 章 中 ， 你 将 使 用 GNOME/GTK+2， 因 此 请 确认 你 安装 了 
2.x 版 本 的 9 
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对 使 用 RPM 包 的 发 行 版 来 说 ， 你 至 少 要 安 狠 如 下 的 RPM 包 : 


gtk2-2.10.11-7.fc7.rpm 
gtk2-devel-2.10.11-7.fc7.rpm 
gtk2-engines-2.10.0-3.fc7.rpm 
libgnome-2.18.0-4.fc7.rpm 
libgnomeui-2.18.1-2.fc7.rpm 
libgnome-devel-2.18.0-4.fc7.rpm 
libgnomeui-devel-2.18.1-2.fc7.rpm 


在 本 例 中 ， 文 件 名 中 的 fc7 指 的 是 Fedora 7 Linux 发 行 版 。 你 的 系统 
显示 的 名 字 可 能 稍微 不 同 。 

在 Debian 或 基于 Debian 的 系统 (如 Ubuntu) 中 ， 你 可 以 使 用 apt- 
get 命 令 从 各 种 镜像 站 点 中 安装 GNOMEGTK- ° 9 ZZ bis n 
http://www.gnome.org ° 

另外 ， 你 也 可 以 党 试 运 行 一 下 GTK+ 的 演示 程序 ， 它 们 展示 了 所 
有 构件 的 外 观 ( 见 图 16-3) : 


$ gtk-demo 
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对 每 个 构件 ， 你 都 可 以 看 到 一 个 Info 标 等 和 一 个 Source 标 签 。 后 者 
显示 了 使 用 指定 构件 的 实际 C 语 言 源 代码 。 这 里 提供 了 大 量 的 示例 。 
X 验 一 个 空白 的 GtkWindow 

让 我 们 以 一 个 最 人 简单 的 GUI 程 序 来 开始 GTK+ 编 程 吧 , 它 用 于 显示 
一 个 窒 口 。 你 将 看 到 GTK+ 库 的 实际 使 用 情况 ， 并 看 到 你 可 以 从 很 少 
的 代码 中 获得 多 少 功能 。 

(1) 输入 程序 的 代码 ,并 把 它 保存 为 gtkl.c: 


tinclude <gtk/gtk.h> 


int main (int argc, 
| 


GtkWidget *window; 


char *argy!]/) 


otk init(éargc, argv); 
window = gtk window, new(GTK WINDOW, TOPLEVEL) ; 
gtk widget show|[window) 
gtk main (li 


return 0; 


(2) 为 编译 gtk1l.c, 请 输入 : 
$ gcc gtk1.c-o gtk1 pkg-config --cflags --libs gtk+-2.0 


注意 ,输入 的 是 反 引 号 ， 而 不 是 单 引 号 。 请 记 住 反 引号 是 要 求 shell 
执行 其 包含 的 命令 并 将 输出 结 采 附加 其 后 。 


当 使 用 以 下 命令 来 运行 这 个 程序 时 ， 你 的 窗口 将 会 弹出 ( 见 图 16- 


4) 


" 注意 ， 你 可 以 对 这 个 窗口 进行 移动 、 调 整 大 小 、 最 小 化 和 最 大 


UK FH — 2818 GJ #include <gtk/gtk.h> 来 包含 必需 的 GTK+ 库 和 相关 库 
iMd 的 头 文件 。 接 着 ， 你 声明 窗口 为 一 个 指向 GtkWidget 的 指 


为 了 初始 化 GTK+ 库 ， 你 必须 调用 gtk_init 函 数 ， 将 命令 行 参数 argc 
和 argv 传 递 给 它 。 这 给 了 GTK+ 一 个 机 会 来 解析 它 需 要 知道 的 任何 命 
。 注意: 你 必须 在 调用 任何 GTK+ 画 数 之 前 对 其 进行 这 样 的 
AYA ° 

这 个 例子 的 核心 代码 是 对 gtk_window_new 的 调用 ,其 函数 原型 是 : 

GtkWidget*gtk_window_new (GtkWindowType type); 

参数 type 根 据 窗 口 的 目的 可 取 下 面 两 个 值 之 一 。 

口 GTK_WINDOW_TOPLEVEL: 一 个 标准 的 有 框架 窗口 。 

口 GTK_WINDOW_POPUP: 一 个 适用 于 对 话 框 的 无 框架 窗口 。 

你 几乎 总 是 使 用 GTK_WINDOW_TOPLEVEL， 因 为 你 将 在 后 面 看 
到 ， 还 有 更 方便 的 创建 对 话 框 的 方法 。 

gtk_window_new 调 用 在 内 存 中 建立 窗口 ， 使 得 在 将 窗口 实际 显示 
在 屏幕 之 前 ， 你 可 以 在 它 里 面 放置 构件 ， 调 整 它 的 大 小 ， 改 变 窗口 的 
标题 等 。 要 实际 显示 窗口 ， 你 需要 调用 
gtk_widget_show:gtk_widget_show (window) 

DM D en 因此 你 只 需 把 窗口 的 引用 传 给 
它 即 可 。 

你 最 后 调用 的 函数 是 gtk_main。 这 个 关键 函数 通过 把 控制 权 交 给 
GTK+ 来 局 动 交 互 过 程 ， 并 且 一 直 运 行 ， 直 到 调用 gtk_main_quit 才 返 
回 。 正 如 你 所 看 到 的 ，gtkl.c 并 未 调用 gtk_main_quit, 因 此 ， 即 使 窗口 
被 关闭 ， 程 序 也 不 会 停止 。 你 可 以 试 着 点 击 关 闭 图 标 ， 你 将 看 到 并 没 
有 返回 命令 提示 符 。 我 们 将 在 下 一 节 学 过 信号 和 回调 函数 之 后 再 来 纠 
正 这 个 错误 。 至 于 现在 ， 你 可 以 在 启动 gtkl 程 序 的 shell 窗 口中 按 下 
Ctrl+C 组 合 键 来 退出 这 个 程序 。 


所 有 的 GUI 库 都 有 一 个 共同 点 : 必须 存在 某 种 机 制 来 啊 应 用 户 动 
作 并 执行 相应 代码 。 一 个 命令 行程 序 的 奢侈 做 法 是 暂停 执行 ， 等 待 用 
户 输入 ， 然 后 采用 switch 语 句 等 方法 让 程序 根据 输入 进行 分 文 执行 。 
但 这 种 方法 并 不 适用 于 GUI 应 用 程序 ， 因 为 应 用 程序 必须 不 断 啊 应 用 
尸 输入， 例如 ， 它 需要 不 断 更 新 窗口 区 域 。 

现代 窗口 系统 用 事件 和 事件 监听 絮 系 统 来 解决 这 个 问题 。 其 思想 
是 ， 每 次 用 户 输入 〈 通 常 是 通过 鼠标 或 是 键盘 ) 都 触发 一 个 事件 。 例 
如 ， 一 次 击 键 会 甬 发 一 个 键盘 事件 。 因 此 ， 程 序 员 需 要 编写 监听 这 些 
事件 的 代码 ， 以 及 当 事 件 被 触发 时 要 执行 的 代码 。 

正如 你 前 面 所 看 到 的 ，X 视 窗 系 统 会 发 出 这 些 事 件 ， 但 是 它们 对 
GTK+ 程 序 员 并 没有 太 大 帮助 ， 因 为 它们 都 是 非常 底层 的 。 当 电 标 按 
包 和 被 点 击 时 ，X 发 出 一 个 包含 鼠标 指针 坐标 的 事件 ， 而 你 真正 需要 知 
道 的 是 用 户 何 时 激活 了 一 个 构件 。 

因此 ，GTK+ 有 它 目 己 的 事件 和 事件 监听 器 系统 ， 它 们 被 称 为 信 
号 和 回调 函数 。 它 们 非常 容易 使 用 ， 因 为 你 可 以 使 用 C 语 言 的 一 个 非 
常 有 用 的 特征 一 一 函数 指针 来 设置 信号 处 理 器 。 

先 看 一 些 定义 : GTK+ 信 号 是 当 某 件 事 (如 用 户 输入 ) AEN, 
由 GtkObject 对 象 发 出 的 。 一 个 与 信号 相连 授 ， 并 且 一 旦 当 信 和 号 被 发 
出 ， 它 束 会 被 调用 的 函数 被 称 为 回调 函数 。 
注意 ，GTK+ 信 和 号 与 第 11 章 中 讨论 的 UNIX 信 和 号 无 关 。 

作为 一 个 GTK+ 程 序 员 ， 你 需要 关心 的 吏 是 ， 如 何 编写 和 连接 回 
调 函 数 ， 因 为 发 出 信号 的 代码 是 内 置 在 特定 构件 中 的 。 

回调 函数 的 原型 通 利 如 下 所 示 : 

void a_callback_function (GtkWidget *widget,gpointer user_data); 

其 中 传递 了 两 个 参数 : 59—T23 188 A Me SMA ia 
针 ， 第 二 个 参数 是 当 你 连接 回调 函数 时 目 己 选择 的 一 个 任意 指针 。 你 
可 将 该 指针 用 于 任何 目的 。 

连接 回调 函数 同样 从 单 。 你 只 需 调用 g_signal_connect, 并 传递 如 下 
M OH IS diae ae 
H : 


gulong g signal connect(gpointer *object, const gchar *name, GCallback func, 
i ata ); 


有 一 点 值得 指出 : 连接 回调 函数 没有 任何 限制 。 你 可 以 将 多 个 信 
号 连接 到 同一 个 回调 函数 ， 也 可 以 将 多 个 回调 画 数 连接 到 同一 个 信 


号 。 有 天 每 个 构件 发 出 的 信号 的 详细 资料 请 参阅 GTK+API 文 档 。 


在 GTK+2 之 前 的 版 本 中 ， 用 于 连接 回调 函数 的 函数 是 
gtk_signal_connectb 该 男 数 已 被 g_signal_connect 取 代 ， 你 在 新 的 代 
码 中 不 应 再 使 用 该 贸 数 。 


在 下 一 个 例子 中 ， 我 们 将 使 用 函数 g_signal _connect ° 
X 验 回调 函数 


在 gtk2c 中 ， 你 将 在 窗口 中 添加 一 个 按钮 ， 并 将 这 个 按钮 
的 “dicked” 信 号 与 回调 画 数 连接 ， 从 而 显示 一 条 短信 息 : 


gt main |}; 


输入 这 个 程序 的 源 代码 并 将 它 保存 为 gtk2.c。 使 用 与 前 面 gtkl.c 示 

例 类 似 的 命令 编译 和 链接 这 个 程序 。 当 运行 这 个 程序 时 ， 你 将 看 到 一 

个 带 按钮 的 窗口 ， 每 次 当 你 点 击 这 个 按钮 时 ， 它 都 会 输出 一 条 短 消息 
( 见 图 16-5) ° 


@ ericf) kayak: /home2/ericfj/writing/eginning Linux Programming 4th Ed/t ~ C x 
füe Edi View Terminal Tabs Help 

[ericfjükayak eric src]$ ./gth2 

Button 1 pressed 1 time(s) 

Button 1 pressed 2 time(s) 

Button 1 pressed 3 time(s) 


Meno World! | 


gtk2.c 的 代码 中 引入 了 两 个 新 特性 : GtkButton 4U [9] 75] ER 数 。 
GtkButtonzé — 六 简单 的 按钮 构件 ， 它 可 以 包含 文本 (在 本 例 中 ， 它 包 
含 的 文本 是 “Hello World”) ,并 在 鼠标 点 击 这 个 按钮 时 发 出 被 称 
为 “clicked” 的 信号 。 

回调 函 数 button_ clicked 通 过 g_signal_connect 函 数 连接 到 按钮 构件 
的 “clicked” f=" = 与 : 


g signal cor 


Am me 
TK ORJE 


SIGNAL_FUNC /íbutton clicked), 


按钮 的 名 称 Button 1 作为 用 户 数据 传递 给 回调 函数 。 
pao 的 其 他 部 分 处 理 按钮 构件 ， 它 的 创建 方法 与 窗口 类 似 ， 调 用 
gtk_button_new_with_label 函 数 ， 然 后 用 gtk_widget_show 使 其 可 见 。 
通过 调用 gtk_container_add 函 数 将 按钮 放置 到 窗口 上 。 这 个 人 简单 的 
eu 年 一 个 GtkWidget 放 到 一 个 GtkContainer 中 ， 并 以 容器 和 构件 作为 


c container add (GtkContainer *container, kWidget *widget 
ET rA 前 看 到 的 ， GakWindow E Gl Conner Apu. 因此 
你 可 以 通过 GKT_CONTAINER 宏 将 窗口 对 象 转 换 为 GtkContainer 类 


gtk_container_add(GTK_CONTAINER (window), button); 


通过 gtk_container_add 辣 一 个 容 絮 里 放置 一 个 构件 是 很 方便 的 ， 但 
更 多 的 情况 是 ， 你 需要 在 一 个 窗口 的 不 同位 置 放置 好 几 个 构件 以 创建 
一 个 像样 的 外 观 。GTK+ 有 专用 于 此 目的 的 构件 一 一 盒 (box) 或 者 容 


器 (container) ° 


16.4 HŽ AE 


GUI 的 布局 对 其 可 用 性 来 说 至 关 重 要 ， 同 样 也 是 最 难 做 好 的 事情 
之 一 。 排 列 构 件 的 真正 困难 在 于 ， 你 不 能 指望 所 有 用 户 都 有 相同 的 屏 
幕 分 辨 座 ， 或 有 相同 的 窗口 大 小 、 主 题 、 字 体 、 颜 色 方 案 。 在 一 个 系 
统 中 令 人 满意 的 界面 在 另 一 个 系统 中 却 可 能 无 法 显示 。 

为 创建 一 个 在 所 有 系统 中 都 保持 一 致 的 GUL 你 要 避免 使 用 绝对 坐 
标 来 放置 构件 ， 而 是 采用 一 种 更 灵活 的 布局 系统 。GTK+ 通 过 容 釉 构 
件 来 实现 这 一 目标 。 它 可 以 用 来 在 应 用 程序 窗口 中 控制 构件 的 布局 。 
盒 构件 是 一 个 非常 有 用 的 容 需 构件 类 型 。GTK+ 还 提供 了 许多 其 他 类 
型 的 容器 构件 ,它们 在 GTK+ 的 在 线 文档 中 都 有 介绍 o 

盒 是 一 个 不 可 见 的 构件 ， 它 的 工作 束 是 包 全 其 他 的 构件 ， 并 控制 
它们 的 布局 。 为 了 控制 盒 中 每 个 构件 的 大 小 ， 你 为 它们 指定 规则 而 不 
是 坐标 。 既 然 盒 构件 可 以 包含 任何 GtkWidget, 而 GtkBox 本 号 承 是 一 个 
GtkWidget, 你 可 以 嵌 套 盒 构 件 来 创建 复杂 的 布局 。 

GtkBox 有 下 面 两 个 主要 的 子 类 。 

口 、GtkHBox 十 一 个 单行 的 横向 组 效 盒 构件 。 

口 、GtkVBox 是 一 个 单列 的 纵向 组 效 盒 构件 。 

在 创建 组 装 盒 时 ， 你 需要 指定 两 个 参数 (homogeneous 和 
spacing) : 

GtkWidget* gtk hbox new (gboolean homogeneous, gint spacing); 
GtkWidget* gtk vbox new (gboolean homogeneous, gint spacing); 


这 些 参 数控 制 特定 组 装 盒 中 所 有 构件 的 布局 。homogeneous 是 一 
个 布尔 值 ， 如 果 它 被 设 为 TRUE, 则 强制 盒 中 的 每 个 构件 都 占据 相同 大 
而 不 管 每 个 构件 的 大 小 。Spacing 以 像素 为 单位 设置 构件 间 
9 间距 e 
一 且 创 建 好 组 逆 盒 之 后 ， 你 区 可 以 用 gtk box pack_start 和 
gtk_box_pack_end 函 数 来 添加 构件 了 : 


void gtk box pack start (GtkBox *box, GtkWidget *child, 
gboolean expand, gboolean fill, 
guint padding); 


void gtk box pack end (GtkBox *box, GtkWidget *child, 
gboolean expand, gboolean fill, 
guint padding); 


gtk_box_pack_start 回 GtkHbox 的 右边 和 GtkVbox 的 底部 增加 构件 ， 
而 gtk_box_pack_end 则 回 GtkHbox 的 左边 和 GtkVbox 的 顶部 增加 构件 。 
它们 的 参数 控制 组 装 盒 中 每 个 构件 的 间距 和 格式 ， 


表 16-1 摘 述 了 可 以 传递 


给 gtk_box_pack_start 或 gtk_box_pack_end 的 
参数 。 


表 16-1 


B Li 8 ay 
aT. Kx WMR 1x5 
€ t ^l Yi 
nux 这 沾 构 1 Dare 4 a ei re franh 
Kx TRUE. MAAMEES EO Wo E RE VL 2. R7 
个 参数 共有 在 ind Àj ATS 
br fet e IN PR S) 0L R A 


现在 让 我 们 来 看 看 这 些 组 装 使 构 件 并 创建 一 个 更 复杂 的 用 户 界 
a ad 


实 验 构件 容器 的 布局 

在 本 例 中 ， 我 们 使 用 GtkHbox 和 GtkVBox 来 排列 一 些 简 
GtkLabel 构 件 。 ,标签 是 一 种 简单 的 构件 , 它 用 于 显示 少量 的 文本 。 
程序 名 为 container.c。 


| 
gtk main quit(); 
] 


* Callback allows th 


€ app a can 
a Jest DI Return TRUE ance 
J ean de eve kWidg widge 


GtkWidget "window; 

GtkWidget *labell, *label2, *iabell; 
GtkWidget *hbox, 

GtkWidget *vbox; 


gtk inít(&argc, sargv); 
window = gtk window new(GTK WINDOW TOPLEVEL); 


gtk window set title|GTK WINDOW|window), "The Window Title’); 
gtk window set position(GTK WINDOW|window)!, GTK WIN FOS CENTER); 
gtk window aet default size!GTK WINDOW|window), 300, 200): 


g.s2ignal connect | GTK OBJECT (window), *deotroy", 
GTK SIGNAL PUNC | closeApp), MULL); 


g signal connect | GK OBJECT (window), *delete event', 
GTK SIGNAL FUNT | delete event), NULLI; 


labell = gtk. label newi|*Label 1*); 
label2 = gtk label new["'Label 2°); 
label} = gtk label newi*Label 3*]; 


hbox = gtk hbox new | TRUE, 5 
vbox = gtk vbox new (| FALSE, 1 


1 
gtk box pack start(GTK BOX(vbox), labell, TRUE, FALSE, 5); 
gtk box pack start(GTK BOX(vbox]. label2, TRUE, FALSE, 5); 
gtk box pack start(GTK BOX (hbox), vbox, FALSE, FALSE, 5]: 

gtk box pack start(GTK BOX(hbox)!, label3, FALSE, FALSE, 5}; 


gtk container Add(GTK CONTAINER (window), hbox}: 


gtk widget show alliwindow]; 
otk main (): 


The Window Titile 


Label 1 
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EW fl) E f W^ 28 7 € MJ fb:hbox 和 vbox。 我 们 用 
gtk_box_pack_start 在 vbox 时 添加 ny ‘label flllabel2, 为 label2 是 在 labell 之 
后 添加 的 ， 所 以 label2 出 现在 确 部 。 接 下 来 ，vbox 本 喘 和 ]label3 一 起 被 
添加 到 hbox 中 。 
wan 后 被 添加 a 到 窗口 中 ， 并 使 用 gtk_widget_show_all 显 示 在 屏 


理解 组 装 盒 布 局 的 最 好 方式 是 通过 图 示 ( 见 图 16-7) ° 


Label1 
r Label3 
Label2 . 
vbox 
EEE hbox 
window 
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GTK+ 最 本 质 的 内 容 。 但 要 成 为 一 个 优秀 的 GTK+ 程 序 员 ， 你 还 需要 了 
解 如 何 充分 利用 好 它 所 提供 的 各 种 构件 。 


16.5 GTK+ 构 件 


在 本 节 中 ， 我 们 将 介绍 应 用 程序 中 最 常用 的 一 些 GTK+ 构 件 的 
API。 


16.5.1 GtkWindow 
GtkWindow 是 所 有 GTK+ 应 用 程序 的 基本 元 素 。 我 们 用 它 来 持 有 构 


件 : 
GtkWidget 
*----GtkContainer 
+----GtkBin 
+----GtkWindow 


有 许多 的 GtkWindow API 调 用 ， 下 面 这 些 是 值得 特别 关注 的 : 


GtkWidget* gtk window new (GtkWindowType type); 

void gtk window set title (GtkWindow *window, const gchar *title); 

void gtk window set position (GtkWindow *window, GtkWindowPosition position); 
void gtk window set default size (GtkWindow *window, gint width, gint height); 
void gtk window resize (GtkWindow *window, gint width, gint hoight); 

void gtk window set resizable (GtkWindow *window, gboolean resizable); 

void gtk window present (GtkWindow *window); 

void gtk window maximize (GtkWindow *window); 

void gtk window unmaximize (GtkWindow *window); 


正如 你 刚才 所 看 到 的 ，gtk_window_new 在 内 存 中 创建 了 一 个 新 的 
衬 白 窗口 。 窗 口 的 标题 没有 设置 ， 窗 口 的 大 小 和 屏幕 位 置 都 没有 定 
义 。 你 通常 会 将 各 种 构件 填 入 其 中 ， 并 设置 一 个 菜单 和 工具 栏 ， 然 后 
才 调 用 gtk_widget_show 在 屏幕 上 显示 它 。 
oe SHE 
注意 : 因为 是 窒 E ige TTE GTK f 52 ail 口 周边 ， 所 以 文字 
字体 、 BEMA NEBR TIR ITAN He o 

gtk window. set position 控制 窗口 在 P s a 的 初始 位 置 。 参 数 
position 有 5 个 取 值 ， 如 表 16-2 所 示 。 


Xx 16-2 


womb (ARAE 


gtk_window_set_default_size 按 GTK+ 绘 图 单元 设置 屏幕 中 窗口 的 
大 小 。 明 确 设置 屏 磊 大 小 可 以 避免 窗口 内 容 不 清楚 或 被 隐藏 。 一旦 窗 
口 在 屏幕 上 显示 ， 你 可 以 通过 gtk_ window_resize 来 强制 调整 窗口 大 
小 。 默 认 情 况 下 ， 用 户 可 以 以 通常 的 方法 通过 拖 息 窗口 边框 来 改变 其 
大 小 。 要 阻止 用 户 这 人 么 做 ， 你 可 以 调用 gtk_window_set_resizable 男 
数 ， 将 参数 resizable 设 为 FALSE。 

为 了 确保 窗口 在 屏幕 上 并 且 对 用 户 是 可 见 的 ， 即 它 没 有 被 最 小 化 
或 隐藏 ， 你 可 以 使 用 gtk window_present 来 完成 这 个 任务 。 
gtk_window_present 对 于 对 话 框 来 说 很 有 用 ， 它 可 以 确保 在 你 需要 用 户 
输入 时 它们 没有 被 最 小 化 。 男 外 ， 要 强制 最 大 化 和 最 小 化 窗口 ， 你 可 
PAS FA gtk_window_maximize#llgtk_window_minimizeLH 2% ° 


16.5.2 GtkEntry 


GtkEntry 是 一 个 单行 文本 输入 构件 ， 它 常用 于 输入 简单 的 文本 信 
轧 ， 例 如 电子 邮件 地 址 、 用 户 名 或 主机 名 。 你 可 以 通过 相应 的 API 调 
用 来 设置 和 读 取 输入 的 文本 ， 设 置 允许 的 最 大 字符 数 ， 以 及 设置 其 他 
一 些 属性 来 控制 文本 的 定位 和 选择 : 

GtkWidget 


+----GtkEntry 


GtkEntry 可 被 设置 为 使 用 星 号 (或 者 任何 其 他 用 户 定 义 的 字符 ) 
来 代 炎 输入 的 字符 ， 这 在 输入 密码 时 很 有 用 ， 因 为 你 不 希望 别人 在 旁 
边 看 到 你 输入 的 文本 。 

下 面 我 们 将 摘 述 最 有 用 的 一 些 GtkEntry 函 数 : 


GtkWidget* gtk entry new (void); 

GtkWidget* gtk entry new with max length (gint max); 

void gtk entry set max length (GtkEntry *entry, gint max); 

G CONST RETURN gchar* gtk entry get text (GtkEntry *entry); 

void gtk entry set text (GtkEntry *entry, const gchar *text); 

void gtk entry append text (GtkEntry *entry, const gchar *text); 
void gtk entry prepend text (GtkEntry *entry, const gchar *text); 
void gtk entry set visibility (GtkEntry *entry, gboolean visible); 
void gtk entry set invisible char (GtkEntry *entry, gchar invch); 
void gtk entry set editable (GtkEntry *entry, gboolean editable); 


你 可 以 通过 gtk entry new 或 固定 最 大 文本 输入 长 度 的 
gtk_entry_new_with_max_length 来 创建 一 个 GtkEntry。 限 制 输入 不 超过 
某 一 长 度 将 省 去 你 检查 输入 长 度 ， 并 通知 用 户 文 本 输入 过 长 的 负担 。 

要 获取 GtkEntry 的 内 容 ， 你 可 以 调用 gtk_entry_get_text 函 数 ， 它 将 
返回 GtkEntry 内 部 的 一 个 const char 指 针 (G_CONST_RETURN 是 一 个 
GLib 定 义 的 宏 ) 。 如 果 你 想 修 改 这 个 文本 或 把 它 传 给 一 个 可 能 修改 它 
的 函数 ， 就 必须 使 用 像 strcpy 这 样 的 函数 来 复制 这 个 字符 毕 。 

你 可 以 通过 _set_text、_append_text、_modift_text 函 数 来 手工 设置 
或 修改 GtkEntry 的 内 容 。 注 意 这 些 函 数 都 使 用 const 指 针 作 为 参数 。 

如 果 想 将 GtkEntry 作 为 一 个 密码 输入 框 使 用 ， 在 显示 字符 的 地 方 
用 星 号 来 代替 ， 你 可 以 用 gtk_entry_set_visibility 芳 数 ， 并 将 它 的 参数 
Visible 设 为 FALSE。 不 可 见 字 符 的 替代 符号 可 以 根据 需要 使 用 
gtk_entry_set_invisible_char 函 数 来 改变 。 


3c US 用 户 名 和 密码 输入 杠 

你 已 经 了 解 了 GtkEntry 画 数 ， 现 在 通过 一 个 小 程序 来 实际 演示 它 
们 。entrye 将 创建 一 个 用 户 名 和 密码 输入 窗口 ， 然 后 将 输入 的 密码 与 
一 个 内 署 的 密码 相 比较 。 

(1) 首先 定义 这 个 内 置 的 密码 ， 就 选 为 secret 吧 . 


#include <gtk/gtk.h> 


include <stdio.h> 


const char * passwo = "secret"; 


(2) 下 面 是 两 个 回调 函数 ， 分 别 在 关闭 窗口 和 点 击 OK 按 钮 时 调 


(3) 在 main 函 数 中 ， 创 建 和 排列 界面 ， 并 且 连 接 好 回调 函数 。 我 
们 用 hbox 和 vbox 容 禹 构件 来 放置 标 答 和 输入 框 构件 。 


int main (int argc, char *argv{}) 


GtkWidget *window; 

GtkWidget *username label, *password label; 
GtkWidget *ugername entry, *password entry; 
GtkWidget *ok,. button: 

GtkWidget *hboxl, *hbox2; 

GtkWidget *vbox; 


grk init[&argc, &argv): 


window = gtk window new (OTK WINDOW TOPLEVEL]; 
gtk window set title|GTK WINDOW(window], "GtkEntryBox*]; 
gtk window set position(GT 

gtk window, ser default si 


i 
ze (GTR_WINDOW (window), 200, 


g.signal.connect | GTK OBJECT [window), “des $ 
GTK_SIGNAL_FUNC | closeApp), NULL): 


username label s gtk label newl "pogin: ds. 
password label = gtk labei new(*Password 


username entry = gtk entry new!| 
password entry = gtk entry new(!: 
gtk entry set visibility|GTK ENTRY [password entry), FALSE); 


ok button = grk button new with label|'Ok"]; 


g signal connect (GTK OBJECT (ok button], “clicked’, 


GTK. SIGNAL FUNCibutton clicked}, password er 


hboxl = gtk hbox new | TRUE, 
hbox2 = gtk hbox new | TRUE, 


km un 


vbox = gtk vbox new | FALSE, 10]; 


gtk. box, pack, scart (OTE 80) oxi), username label, TRUE, FALSE, 
gtk box pack start(GTK BOX(hboxi], username entry, TRUE, FALSE, 


gtk.box.pack start(GTK BOX|hbox2), password label, TRUE, FALSE, 
gtk box pack start(GTK, BOX(hbox2), password entry, TRUE, FALSE, 


gtk box pack start(GTK BOX(vbox). hboxl, FALSE, FALSE, 5): 
gtk box pack starct(GTK BOXivbox), hbox FALSE, FALSE, 5]; 
gtk.box pack start(GTK BOX[vbox), ok button, FALSE, FALSE. 3 


gtk container_add (GTX_CONTAINER (window), vbox) ; 


gck widget show, 211(window 
gtk main 


return 0; 


运行 这 序 ,你 会 看 到 如 图 16-8 所 示 的 窗 


这 个 程序 创建 了 两 个 GtkEntry p ft 


K_WINDOW (window), GTK WIN POS CENTER]; 


( username entry 和 


password . a) ,并 将 password_entry 的 可 见 性 设 为 FALSE 来 隐藏 输入 


的 密码 
button_clicked 回 调 函 数 。 


在 回调 函数 中 ， 程 序 将 获取 输入 的 密码 ， 并 将 它 


比较 ， 然 后 显示 适当 的 信息 。 


然后 它 创 建 了 一 个 GtkButton, 并 将 它 的 “dlicked” 


言 号 连接 到 
与 内 置 的 密码 做 


注意 ， 我 们 多 次 使 用 gtk_box_pack_start 语 句 来 癌 容 器 中 增加 构 
n eJ p bim. EROS BIB IT HR XE SC 1 8 JI ER 
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16.5.3 GtkSpinButton 


有 了 时候 ， 你 需要 用 户 输 入 一 个 数字 类 型 的 值 ， 例 如 一 个 设备 的 最 
大 速度 或 长 度 。 在 这 种 情况 下 ， 使 用 GtkSpinButton 是 最 理想 的 。 
GtkSpinButton 限 制 用 户 只 能 输入 数字 字符 ， 你 可 以 为 输入 值 设置 上 界 
和 下 界 。 这 个 构件 还 提供 同上 和 疝 下 的 稍 头 ， 用 户 仅 用 鼠标 就 可 以 很 
方便 地 选择 数值 。 

GtkWidget 
+----GtkEntry 
+----GtkSpinButton 


RA DASA PIER CHB AIR HT, PERITA] E ey H BER RC 


GtkWidget* gtk spin button new (GtkAdjustment ‘adjustment, gdouble climb rate, 
guint digits); 

GtkWidget* gtk spin button new with range (gdouble min, gdouble max, gdouble step); 

void gtk spin button set digits (GtkSpinButton *spin button, guint digits); 

void gtk spin botton set increments (GtkSpinButton *spin button, gdouble step, 
gdouble page); 

void gtk spin button set range (GtkSpinButton "spin button, gdouble min, 
gdouble max); 

gdouble gtk spin button get value (GtkSpinButton *spín button); 

gint gtk spin button get value as int (GtkSpinButton *spin button); 

void gtk spin button set value (GtkSpinButton *spin button, gdouble value); 


要 使 用 gtk_spin_button_new 来 创建 一 个 GtkSpinButton, 你 首 移 需要 
创建 一 个 GtkAdjust- ment 对 象 。GtkAdjustment 是 一 个 抽象 对 象 ， 它 包 
舍 控 制 有 界 数 值 的 逻辑 。GtkAdjustment 也 在 其 他 构件 中 使 用 ， 如 
GtkHScale 和 GtkVScale ° 
ee ,你 需要 给 它 传递 一 个 初始 值 、 上 界 、 下 界 和 
Ie 

GtkObject* gtk adjustment new (gdouble value, gdouble lower, gdouble upper, 


gdouble step_ increment, gdouble page increment, 
gdouble page size); 


step_ increment#llpage_ increment 的 值 分 别 设置 最 小 和 最 大 递增 量 。 
在 使 用 GtkSpinButton 的 情况 下 ，step_increment 设 置 点 击 箭头 时 值 变化 
的 量 。page_increment 和 page_size 对 于 GtkSpinButton 来 说 不 重要 。 
gtk_spin_button_new 的 第 二 个 参数 dimb_rate 用 于 控制 当 你 持续 按 
Bil ap SEAL RUBE LS 快慢 。 FUE 参数 digits 设 置 构件 的 精度 。 因 
此 ， 当 digit 值 为 3 时 ，spin 按 钮 将 显示 0.00。 
gtk_spin_button_new_with_range 可 以 很 方便 地 在 创建 
同时 创建 一 个 GtkAdjustment, 你 只 需 传 递 给 它 上 下 界 和 
A s HI RT o 
使 用 gtk_spin_button_get_value 可 以 很 容易 地 读 取 到 当前 值 。 如 采 
和 硕 望 获得 一 个 整数 值 ， 你 可 以 使 用 gtk_spin_button_get_value_as_int ° 


sx 验 GtkSpinButton 
你 将 通过 一 个 小 例子 看 到 GtkSpinButton 的 实际 使 用 情况 。 这 个 程 
序 名 为 spin.c ° 


#include <gtk/gtk.h> 


void closeApp | GtkWidget ‘window, gpointer data) 


gtk main quit(): 


int main (int argc, char *argviil! 


f 


t 


GtkWidget "window; 
StkWidget *spinbutton; 
GtkObject ‘adjustment: 


gtk_init [(&argc. Sargv)) 


window gtk window new|GTK WINDOW TCPLEVEL);:; 


gtk window sot default size ( GTK WINDOW(window], 300, 


Q.signal.connect ( OTK OSJECT (window), "destroy", 


200): 


GTK SIGNAL FUNC | closeAppl, NULL): 


sájustmant = gtk adjustment new[100.0, 50.0, 150.0, 0.5, 
spinbutton > gtk spin burton new(GTK ADJUSTMENT (adjustment), 0,01, 2): 


gtk container sdd(GTK CONTAINER [window], spinbutton) 1 


gtk widget shcw alliwindow!; 
gtk main 1): 


iS HEC MBF, RAS 3 BIES0-- 1002 TAI ANH 
按钮 ( 见 图 16-9) ° 


图 16-9 


16.5.4 GtkButton 


0.05, 0.05); 


M 


i 


HE 
H 


(spin) 


你 已 在 程序 中 看 过 GtkButton 的 使 用 情况 ， 但 是 从 GtkButton 还 派生 
出 很 多 按钮 构件 ， 它 们 有 着 更 丰富 的 功能 ， 非 常 值得 一 提 : 
GtkButton 

+---- GtkToggleButton 

+----GtkCheckButton 
卡 一 一 一 一 GtkRadioButton 


从 上 面 的 构件 层次 图 中 可 以 看 到 ，GtkToggleButton 直接 继 承 目 
GtkButton,GtkCheckButton 继 承 自 GtkToggleButton,GtkRadioButton 继 承 
目 GtkCheckButton。 每 个 子 构件 都 有 其 专门 用 处 。 

1. GtkToggleButton 

GtkToggleButton 和 GtkButton 几 乎 完全 一 样 ， 但 它们 之 间 有 一 个 重 
要 区 别 : 前 者 拥有 状态 。 也 就 是 说 ， 它 可 以 打开 或 关闭。 当 用 户 点 击 
GtkToggleButton 上 时 ， 它 按 通常 的 方式 发 出 “clicked” 信 号 ， 并 改变 (或 
切换 ) i 其 状态 。 

GtkToggleButton 的 API 画 数 非常 简单 明了 : 


GtkWidget* gtk toggle button new (void); 

GtkWidget* gtk toggle button new with label (const gchar *label); 

gboolean gtk toggle button get active (GtkToggleButton *toggle button); 

void gtk toggle button set active (GtkToggleButton *toggle button, 
gboolean is active); 


Pj ^ [HOUR UOTE AY EM XX 4 ogtk toggle button get active 和 
gtk_toggle_button_set_active, 你 调用 它们 来 读 取 和 设置 开关 按钮 的 状 
态 。 一 个 TRUE 返 回 值 表明 GtkToggleButton 处 于 “ 开 ” 状 态 。 

2. eh Ghee button 

GtkCheckButton 是 一 个 变相 的 GtkToggleButton ° E 
GtkToggleButton 那 样 显示 — 4-4 A HR A R, 而 是 显示 一 
mn uem JE, je HRMS ATA, RENS MORE IUE 

异 


GtkWidget* gtk check button new (void); 
GtkWidget* gtk check button new with label (const gchar *label); 


3. GtkRadioButton 
这 个 按钮 与 前 面 的 有 很 大 不 同 ， 因 为 它 可 以 与 同类 型 的 其 他 按钮 
分 为 一 组 。GtkRadioButton 是 这 样 一 种 按钮 ， 它 允许 你 一 次 只 能 从 一 
组 洗 项 中 选择 一 个 。 它 的 名 字 来 源 于 老式 的 收 首 机 一 一 它们 有 许多 机 
械 按键 ， 当 你 按 下 一 个 按键 时 ， 其 他 的 按键 都 将 弹 起 来 。 


GtkWidget* gtk radio button new (GSList *group); 
GtkWidget* gtk radío button new from widget (GtkRadioButton *group); 


GtkWidget* gtk radio button new with label (GSList *group, const gchar *label); 
void gtk radio button set group (GtkRadioButton *radio button, GSList *group); 
GSList* gtk radio button get group (GtkRadioButton *radio button); 


RadioButton 〈 单 选 按钮 ) 组 由 一 个 Glib 的 列表 对 象 GSList 表 示 。 
为 了 将 单 选 按钮 放 在 一 个 组 里 ， 你 可 以 创 键 一 个 GSlist, 并 通过 
radio_button_get_group 来 将 它 传递 给 每 一 个 
DEED 9 Su 还 有 一 个 更 简单 的 方法 ， 通 过 
gtk_radio_button_new_ ae widget 可 以 从 一 个 现 有 的 按钮 中 获取 
GSList。 你 将 在 下 一 个 例子 中 看 到 的 使 用 方法 。 o 在 下 面 的 例子 中 ， 
我 们 将 使 用 不 同 的 GtkButton ° 


sx 验 GtkCheckButton、GtkToggleButton 和 GtkRadioButton 
输入 下 面 这 个 程序 ， 并 把 它 命名 为 buttons.c。 (1) 首先 将 按钮 指 
针 声 明 为 全 局 变量 


(2) 这 里 我 们 定义 了 一 个 辅助 函数 ， 它 将 GtkWidget 和 GtkLabel 
放 入 一 个 GtkHbox 中 ， 然 后 将 这 个 GtkHbox 添 加 到 一 个 指定 的 容器 构 
pees SR Sl BUI 


(3) print_ activexe 75 — | TRIB EMSS, “TEDL 1 TEXTE FER BT 
fea h 28 «E GtkToggleButtonB] 4 RAS ° "Ez fEbutton. clicked X BX FP $6 Vs] 
H, XXERSUE— TS OKTZ E Bclickedfzi 7 HIER IB USER 9» BIN 
个 按钮 被 点 击 时 ， 你 都 将 获得 一 个 按钮 状态 的 输出 信息 。 


void print_active(char * button name, GtkToggleButton *button) 
( 
gboclean active = gtk toggle button get active button! : 


printf("te is te\n", button nase, active?*active’:*not active’); 
} 


void button_clickediGtkWidget “button, gpointer data) 

{ 
print active(*Checkbutton*, GTK TOGGLE, BUTTON ( checkbut ton) | ; 
prínt active(*Togglebutton*, GTX TOGGLE BUTTON(togglebutton]); 
print active|*Radiobuttonl*, GTK TOGGLE BUTTON|radiobuttonl]]: 
print active("Radiobutton2*, GTX TOGGLE BÜTTON(radiobutton2]]: 
print£ (*3n*); 


(4) 在 main 函 数 中 ， 你 创建 按钮 构件 ， 将 它们 放 在 一 个 GtkVbox 
中 并 加 上 摘 述 标签 ， 然 后 将 回调 信号 连接 到 OK 按钮 : 


gint main (gint argo, gchar *argv[)) 
{ 

GtkWidget "window: 

GtkWidget *button; 

GtkWidget *vbox; 


gtk_init (sarge, &argv!; 
window = gtk window, new[GTK, WINDOW TOPLEVEL): 
gtk window set default size(GTK WINDOW|window), 200, 200); 
g.signal connect | OTK OS3JECT [window), "destroy", 
OTKE SIGKAL FUNC icloseAppl. NULL); 


button * gtk button new with label|*Ok*|; 

togglebutton = gtk toggle hutton new with lsbel[*'Toggie*!; 

checkbutton = gtk check botton new); 

rad$iobuttoni = gtk radio button newiNULL!; 

radiobutton2 = gtk radio button new, from widget(OTK, RADIO BUTTON (zadiobuttonl)] 1 


vbox = gtk vbox new (TRUE, 4)) 

add widget with label (GTK CONTAINER(vbox)], *'ToggleButton:*, togglebutton]: 
add widget with label (GTK CONTAINER(vbox), ‘CheckButton:*, checkbutton}; 
add widget with label (GTK_CONTAINER(vbox), ‘Radio 1:*, radiobuttonl]; 
add. widget with label (OTE CONTAINER(vDOx), "Radio 2:*'. radiobutton2]): 

edd widget with label (OX CONTAINER(vbox], "Button:*, button); 


aq. signal connect(OTX DBSJECT(button), "clicked", 
OTK.SIONAL.PUNC[button. clicked], NULLI; 


gtk container add(CTM CONTAINER (window), wvbox): 
grk widget show alliwindow); 
gtk main (}1 


return 0; 
l 


16-10 显 示 了 buttons.c 程 序 的 运行 情况 ， 里 面 有 4 种 常见 类 型 的 
GtkButton ° 
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Togglebutton is active 

Radiobuttonl is not active 

Radiobutton2 it active 

Checkbutton is active 

Togglebotton is active | 
toggleButton- | logge 

Radiobuttonl 14 active t 


Radicbutton2 is not active 
CheckBullon: v 


0 
Radio 1: 
Radio 2 


Burton ok 
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点 击 OK 可 以 看 到 各 种 按钮 的 状态 。 

这 个 程序 是 一 个 简单 的 示例 ， 它 使 用 了 4 种 类 型 的 GtkButton, 并 显 
示 了 你 如 何 通过 一 个 单独 的 函数 gtk_toggle_button_get_active 来 读 取 
GtkToggleButton、GtkCheckButton 和 GtkRadio- Button 的 状态 。 这 是 面 
向 对 象 方法 最 大 的 好 处 之 一 ， 因 为 你 不 需要 为 每 个 button 类 型 准备 单 
JHA get 一 active 函 数 ， 从 而 城 少 了 代码 量 。 


16.5.5 GtkTreeView 


至 此 ， 我 们 已 看 到 了 一 些 简单 的 GTK+ 构 件 ， 但 并 不 是 所 有 的 构 
件 都 是 单行 输入 或 显示 的 。 GtkWidget 的 复杂 性 也 没有 受到 任何 限 
制 ，GtkTreeView 就 是 一 个 很 好 的 例子 ， 它 封装 了 大 量 的 功能 : 
GtkWidget 
+----GtkContainer 


+----GtkTreeView 


GtkTreeViewzé GTK+2 134 WKS (FIR tbo, E np Liat TF 
表格 或 文件 管理 器 中 常见 的 数据 的 树 和 列表 视图 。 通 过 GtkTreeView， 
你 可 以 创建 数据 、 混 合 文本 、 位 图 、 甚 至 是 使 用 GtkEntry 构 件 输入 的 
数据 等 的 复杂 视图 。 


ill iX GtkTree View 3g TRUK AY 77 YEW EIS £1 GTK+ Hl TF HY gtk-demohy, 
用 程序 。 这 个 演示 程序 展示 了 包括 GtkTreeView 在 内 的 各 种 GTK+ 构 件 
的 能 力 ， 如 图 16-11 所 示 。 


Jonathan's Holiday Card Planning Sheet 
Holiday Alex Have Tm Owen Dave 


New Years Dey w z Pi A 
Presidential inauguration * r 
Martin Luther King jr day z + 


April Fools’ Oay 
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GtkTreeView 构 件 族 由 下 面 4 个 组 件 构 成 。 

O GtkTreeView: 树 和 列表 视 

口 、GtkTreeViewColumn: 代 表 一 个 列表 或 树 的 列 

口 、GtkCellRenderer: 控 制 绘图 单元 

口 、GtkTreeModel: 代 表 树 和 列表 数据 

前 3 个 组 成 了 所 谓 的 视图 (view) ,最 后 一 个 是 模型 (model) 。 这 
种 将 视图 和 模型 分 开 的 概念 (通常 称 为 模型 /视图 /控制 器 设计 模式 ， 
或 简称 为 MVC) 并 不 是 GTK+ 专 有 的 ， 而 是 一 个 在 整个 软件 行业 越 来 
越 受 到 青睐 的 设计 模式 。 

MVC 设 计 模式 的 主要 优点 是 ， 数 据 可 以 同时 由 不 同 的 视图 展示 ， 
而 不 需要 进行 不 必要 的 复制 。 例 如 ， 文 本 编辑 器 可 以 分 不 同 的 窒 格 来 
编辑 文档 的 不 同 部 分 ， 而 不 需要 在 内 存 中 保留 文档 的 两 个 副本 。 

MVC 模 式 在 Web 编 程 中 也 很 受 欢迎 ， 这 是 因为 它 使 得 你 可 以 轻松 
创建 一 个 满足 如 下 要 求 的 Web 站 点 : (8 Fg st cba AE 
手机 或 WAP 浏 蜗 絮 上 展示 内 容 。 你 只 需 针 对 每 种 浏览 絮 类 型 开发 独立 
优化 的 视图 组 件 即 可 。 你 还 可 以 将 获取 数据 的 逻辑 (如 查询 数据 库 ) 
与 用 户 界面 逻辑 相 分 离 。 


我 们 先 来 介绍 模型 组 件 ，GTK+ 有 两 个 这 样 的 组 件 : GtkTreeStore 
i ae 目录 层次 结构 这 样 的 多 级 数据 ，GtkListStore 用 于 存储 平面 
数据 。 
x T le — T GtkTreeStore, cs IRE — TIN, BEBE RIA 


YY vt "EN ES ete Th TYDE TAFT 
re = TEX Cree £4 re _STRING, 5 LIFE iNi, 


3. TYPE. BOOLEAN 


Mstore H BEA ^ HAT ^ Bia AO MT ER OC a mix Ze [6 H1 GtkTreelter 24 
T5 o HE aa PATE RED E 〈 或 列表 中 的 行 ) ， 并 对 可 能 非 
利 大 的 数据 结构 中 的 一 部 分 进行 定位 和 操纵 。 有 好 几 个 API 函 数 可 以 
获取 树 中 不 同位 置 的 迭代 句 对 象 ， 但 我 们 将 只 介绍 最 简单 的 
gtk tree store append ° 
TE [E] PR store PASTE aH ZB, UR T T XS T i] BOR dH IR] 
一 个 新 行 。gtk_tree_store_ append 在 树 中 填 入 一 个 GtrTreelter 对 象 ， 该 
对 象 代表 一 个 新 行 ， 这 个 新 行 或 是 一 个 顶层 行 (如 果 你 传递 的 第 三 个 
参数 是 NULL) ,或 者 是 一 个 子 行 (如 果 你 传递 的 第 三 个 参数 是 父 行 的 
迭代 器 对 象 ) o 
GtkTreeIter iter; 
gtk tree store append (store, &iter, NULL); 
x HA f—T3XXSTONI SR, URL RI DGBXgtk tree store set?£1R TIX 
de 
gtk tree store set (store, &iter, 
0, "Def Leppard", 
1, 19:37; 
2, TRUE, 
-1); 
你 成 对 地 传递 列 号 和 数据 ， 以 -1 结束 。 你 将 在 后 面 使 用 一 个 枚 举 
类 型 来 增加 列 号 的 可 读 性 。 
为 给 该 行 增加 一 个 分 文 (一 个 子 行 ) ， 你 只 需 通 过 再 次 调用 
并 传递 一 个 顶层 行 来 为 子 行 创建 一 个 迭代 器 对 


GtkTreeIter child; 


gtk tree store append (store, &child, &iter); 


ff n] DAZE APICES F FR 81] 58 Ze GtkTreeStore Fil GtkListStore TH K EK Zt 
的 资料 。 下 面 我 们 将 介绍 GtkTreeView 视 图 组 件 。 

创建 GtkTreeView 本身 很 简单 ， 你 只 需要 问 构 造 落 数 传 递 
GtkTreeStore 或 GtkListStore 模 型 即 可 : 


现在 是 配置 构件 让 它 准 确 显示 数据 的 时 候 了 。 针 对 每 列 ， 你 都 必 
须 定 义 一 个 GtkCellRenderer (ARREZ) 并 设置 数据 源 。 例 如 ， 你 
可 以 选择 只 显示 某 些 列 或 交换 列 的 显示 顺序 。 

GtkCell]Renderer 是 一 个 用 于 处 理 在 屏幕 上 绘制 每 个 单元 格 的 对 
象 。 它 有 3 个 子 类 ， 分 别 用 于 处 理 文 本 单元 格 、 位 图 图 形 单元 格 和 开关 
按钮 单元 格 ， 如 下 所 示 : 

Oh GtkCellRendererText; 

[] GtkCellRendererPixBuf; 

O GtkCellRendererToggle ° 

REMER FEH Sc AN R Ge as Gtk CellRendererText: 


这 里 你 创建 了 渲染 絮 对 象 并 将 它 传 递 给 列 插入 函数 。 这 个 函数 通 
过 传递 给 它 的 以 NULL 结 尾 的 键 / 值 对 ， 一 次 就 设置 好 了 
GtkCellRendererText 属 性 。 传 给 函数 的 参数 分 别 是 树 视图 、 列 号 、 列 
标题 、 演 染 强 对象 和 泻 染 独 属 性 。 这 里 你 设置 了 text 属 性 ， 传 递 了 数据 
源 的 列 号 。GtkCellRendererText 还 定义 了 其 他 几 个 属性 ， 包 括 下 划 
线 、 字 体 、 大 小 等 。 

你 将 在 下 面 的 例子 中 看 到 GtkTreeView 的 实际 使 用 情况 。 


实 验 GtkTreeView 
输入 这 个 程序 ， 将 它 命 名 为 tree.c. 
(1) 程序 使 用 一 个 枚 举 类 型 来 标记 列 ， 这 样 你 就 可 以 用 名 字 来 引 
用 它们 。N_COLUMNS 是 总 列 数 。 


#include «gtk/gtk.h» 


enum { 
COLUMM TITLE, 
COLUMN ARTIST, 
COLUMN CATALOGUE, 
N -COLUMNS 

he 


void closeApp | GtkWidger ‘window, gpointer data) 
t 

gtk main quit()]: 
} 


int main {int argc, char *argvil) 
{ 
GtkWidget *window; 
GtkTreeStore ‘store: 
GtkWidget *view; 
GtkTreelter parent iter, child iter; 
GtkCellRenderer *renderer; 


gtk inir[&argc, &argv): 

window = gtk window new(GTK WINDOW TOPLEVEL]; 

gtk window set default size ( GTK.WINDOW(window], 300, 200); 

wg. signal connect | GTK OBJECT (window), "'destroy*. 
GTK.SIGNAL FUNC | closeApp), NULL): 


(2) 下 面 创建 了 树 store, 并 向 其 传递 列 的 总 数 和 每 列 的 类 型 : 


store = gtk tree store new [N COLUMNS, G TYPE STRING, G_TYPE_STRING, 


G, TYPE STRING) ; 


INA) A PES SUIT cu 
(3) 接 下 来 向 树 中 增加 一 个 父 行 和 一 个 子 行 : 
gtk tree store append (store, &parent iter, NULL); 
gtk tree store set (utore, &parent iter, COLUMN TITLE, "Dark Side of the Moon*, 
COLUMN ARTIST, "Pink Floyd’, 
COLUMN, CATALOGUE, *B000024D4P* 
11: 
gtk tree store append (store, &child iter, &parent iter); 
gtk tree store set (store, &chíld iter, COLUMN TITLE, *Speak to Me*, 
-1)} 


view = gtk tree view new with model (GTK TREZ MODEL [storel]: 


(4) 最 后 ， 把 列 加 到 视图 中 ， 并 设置 它们 的 数据 源 和 标题 : 


gtx_tree_vie t umn with. e E 
gtk, container, add 一 TA 

gtk w et show alliwindow) 

gtk m 

eturn i 


后 面 会 把 GtkTreeView 作 为 CD 应 用 程序 的 核心 ， 在 该 程序 中 查询 
CD 数据 库 时 ， 我 们 将 修改 GtkTreeView 的 代码 。 

我 们 已 经 了 解 了 GTK+ 构 件 ， 现 在 我 们 将 把 注意 力 转 同 GNOME 。 
后 面 我 们 将 学 习 如 何 使 用 GNOME 库 向 应 用 程序 中 添加 菜单 ， 以 及 
GNOME 构 件 是 如 何 使 得 为 GNOME 桌 面 编 程 变 得 更 容易 © 


16.6_GNOME 构 件 


GTK+ 人 被 设计 成 独立 于 桌面 的 。 也 就 是 说 ，GTK+ 并 不 假定 它 运 行 
在 GNOME 中 ， 甚 至 不 假定 它 运行 在 Linux 上 。 这 样 ，GTK+ 残 可 以 被 
相对 容易 地 移植 到 Windows 或 者 任何 其 他 视窗 系统 中 。 可 这 样 导 致 的 
结果 是 ，GTK+ 缺 乏 将 程序 与 桌面 紧密 结合 的 方法 ,例如 保存 程序 配 
置 、 显 示 帮 助 文件 或 编写 applet (applet 是 在 边缘 面板 上 运行 的 小 程 
Fr) BE 

GNOME 库 包含 GNOME 构 件 ， 它 们 扩展 了 GTK+, 并 用 一 些 更 容易 
使 用 的 构件 替换 了 GTK+ 中 的 部 分 构件 。 在 本 下 中 ， 我 们 将 看 到 如 何 
用 GNOME 构 件 来 编程 。 

在 使 用 GNOME 库 之 前 ， 你 必须 在 程序 的 一 开始 对 它们 进行 初始 
化 ， 束 像 你 在 使 用 GTK+ 时 所 做 的 那样 。 你 在 纯 GTK+ 程 序 中 调用 的 是 
gtk_init, 在 这 里 调用 的 是 gnome_program init ° 

这 个 函数 的 参数 有 : app_id 和 app_version (用 于 疝 GNOME 描 述 你 
的 程序 ) ^ module info 〈 告 诉 GNOME 初 始 化 哪个 库 模 块 ) 、 命 令 行 
参数 和 应 用 程序 属性 (设置 为 以 NULL 结 尾 的 “名 / 值 ” 对 列表 ) 。 


GnomeProgram* gnome program init (const char *app id, const char *app version, 
’ 


, Char **argv, 
const char *first property name, 
) 


可 选 的 属性 列表 用 来 设置 一 些 属性 ， 如 位 图 查找 目录 。 


实 验 一 个 GNOME 窗 口 

现在 让 我 们 来 看 一 个 GNOME 程 序 ， 注 意 GtkWindow 在 GNOME 中 
被 巷 代 为 GnomeApp 构 件 。 

输入 这 个 程序 ， 将 它 命 名 为 gnomel.c: 


为 编译 这 个 程序 ， 你 需要 包 仿 GNOME 类 文件 ， 因 此 传递 
libgnomeui 和 libgome 给 pkg-config: 


gcc gnomel.c -o gnomel pkg-config --cflags --libs libgnome-2.0 libgnomeui-2.0' 
GnomeApp 构 件 对 GtkWindow 进 行 了 扩展 ， 使 得 添加 菜单 、 工 具 
栏 以 及 底部 的 状态 栏 变 得 很 容易 。 因为 GnomeApp 继 承 El GtkWindow, 
Fir LAUR RT BRE GnomeA ppt) fF FH T- ££ffif GtkwindowENZX » BE ROK, Jf 
TEES] MS o FEAR RR PIB, RESI -MIAASEE © 
你 可 以 使 用 GTK+ 来 创建 菜单 ， 但 GNOME 所 提供 的 结构 和 安 
使 得 这 个 工作 变 得 更 容易 了。 在 线 的 GTK+ 文 档 描述 了 如 何 使 用 
GTK+ 来 创建 菜单 。 


16.7 GNOME 


在 GNOME 中 创建 一 个 下 拉 式 的 荣 单 栏 非常 简单 。 荣 单 栏 中 的 每 
个 菜单 都 由 一 个 GNOMEUIInfo 结 构 的 数组 来 表示 ， 数 组 中 的 每 个 元 素 
对 应 于 一 个 菜单 项 。 例 如 ， 如 果 你 有 File、Edit、View3 个 菜单 ， 就 用 3 
个 数组 来 分 别 描述 每 个 菜单 的 内 容 。 

一 旦 定义 好 每 个 菜单 ， 你 就 可 以 通过 在 男 一 个 GNOMEUIInfo 结 构 
的 数组 中 引用 这 些 数组 来 创建 菜单 栏 本 身 。 

GNOMEUTIInfo 结 构 有 点 复杂 ， 需 要 解释 一 下 : 


typedef struct { 
GnomeUIInfoType type; 
gchar const *label; 
gchar const *hint; 
gpointer moreinfo; 
gpointer user_data; 
gpointer unused data; 
GnomeUIPixmapType pixmap type; 
gconstpointer pixmap info; 
guint accelerator key; 
GdkModifierType ac mods; 
GtkWidget *widget; 
) GnomeUIInfo; 
该 结构 中 的 第 一 项 type 定 义 了 菜单 元 素 的 类 型 。 它 可 以 是 GNOME 
定义 的 10 个 GnomeUIInfoType 类 型 中 的 一 个 ， 如 表 16-3 所 示 。 


表 16-3 


该 结构 中 的 第 二 个 和 第 三 个 成 员 定 义 亲 单项 的 文本 和 弹出 提 

示 (提示 显示 在 窗口 底部 的 状态 HEA) o 

moreinfo 的 目的 取决 于 type。 对 ITEM 和 TOGGLEITEM, 它 指向 菜单 
项 被 激活 时 调用 的 回调 函数 。 对 RADIOITEMS, 它 指 回 一 个 定义 单 选 按 
钮 组 的 GnomeUIInfo 结 构 数 组 。 

user_data 是 一 个 传递 给 回调 函数 的 任意 指针 。pixzmap_type 和 
pixmap. info H F 2y 3 F& 35i 308 JJ — A sr b^, accelerator key 和 
ac_modes 用 于 定义 一 个 快捷 键 。 
T ign, widget H T (EI ab TR T£ EH 31e ER. G1] E ER TCR [8] BJ Se FD) 


实 验 NOMBRE 
ee 过 这 个 小 程序 来 试 一 试 采 单 ， 这 个 程序 名 为 menul.c。 


(1) 为 菜单 项 定义 一 个 回调 函数 item_dlicked: 


"ked (GtkWidget *widget, gpointer user data) 


(2) 接 下 来 是 菜单 定义 。 你 有 一 个 于 菜单 、 一 个 顶层 菜单 和 一 个 
对 单位 数组 : 


*SubMenu Hint*, 
NULL, NULL, 0, NULL, 0, 0, NULL), 
L, NULL, NULL, NULL, NULL, 0, NULL, 0, 0, NULL) 


em 2", “Menu Hint*, submenu, 


NULL, NULL, NULL, NULL, NULL, 9, NULL, 0, 0, NULL) 


"Tcpievel Item", NULL. menu, NULL, 


GNOME APP UI ENDOFIMNF( NULL, NULL, NULL, NULL, NULL, 0, NULL, 0, 0, NULL) 


(3) 在 main 函 数 中 ， 一 些 初 始 化 ， 然 后 创建 GnomeApp 构 件 
FEKE: 


int main (int argc, char *argvi] 


gram init (*gnomel*, *0.1*,. LIBGNOMEUI MODULE, 


AIGC, orgy, 

GNOME PARAM, NONE) } 
apr gnome app new[*gnomel", "Menus, menus, menus"); 
gtk window set default size GTK_WINDOW (app), 300, 290); 


g E tapp), “destroy”, 
FUNC closeAppn), NULL 
gnome_app create menus ( GNOME APP(app), menubar); 


gtk widget show(app): 


试 着 运行 menul 程 序 ， 你 可 以 看 到 菜单 栏 、 子 菜单 及 回调 函数 的 
实际 运行 情况 ,如 图 16-12 所 示 。 


EJ Menus, menus, menus 


Toplevel Item. 


Menu Item 1 


submenu 


图 16-12 


GnomeUIInfo 结 构 对 程序 员 不 是 太 友 好 ， 因 为 它 包含 11 个 成 员 ， 
大 多 数 成 员 的 值 在 通常 情况 下 都 是 NULL 或 零 。 你 在 输入 它们 的 时 候 
很 容易 出 错 ， 而 且 在 一 个 很 长 的 荣 单 项 数组 中 ， 你 很 难 将 它们 一 一 区 
分 。 为 了 改善 这 种 情况 ，GNOME 定 义 了 宏 来 减少 手工 输入 的 氢 烦 。 
这 些 宏 还 可 以 增加 图 标 和 键盘 快捷 键 ， 而 不 需要 任何 开销 。 事 实 上 ， 
我 们 没有 任何 理由 不 使 用 这 些 宏 。 

有 两 组 安 ， 第 一 组 定义 单独 的 某 单 项 。 它 们 需要 两 个 参数 : 回调 
函数 指针 和 用 户 数 据 。 


#include «libgnomeui/libgnomeui.h» 


#define GNOMEUIINFO MENU OPEN ITEM (cb, data) 
#define GNOMEULINFO MENU SAVE_ITEM (cb, data) 
#define GNOMEUIINFO MENU SAVE AS ITEM (cb, data) 
#define GNOMEUIINFO MENU PRINT ITEM (cb, data) 
#define GNOMEUIINFO MENU PRINT SETUP ITEM(cb, data) 
#define GNOMEUIINFO MENU CLOSE ITEM (cb, data) 
#define GNOMEUIINFO MENU EXIT ITEM (cb, data) 
#define GNOMEUIINFO MENU QUIT ITEM (cb, data) 
#define GNOMEUIINFO MENU CUT ITEM (cb, data) 
#define GNOMEUIINFO MENU COPY ITEM (cb, data) 
#define GNOMEUIINFO MENU PASTE ITEM (cb, data) 
#define GNOMEUIINFO MENU SELECT ALL ITEM(cb, data) 


. etc 


第 二 组 用 于 顶层 菜单 定义 ， 你 只 需 传 递 数 组 即 可 : 


#define GNOMEUIINFO MENU FILE TREE (tree) 
#define GNOMEUIINFO MENU EDIT TREE (tree) 
#define GNOMEUIINFO MENU VIEW TREE (tree) 
#define GNOMEUIINFO MENU SETTINGS TREE (tree) 
#define GNOMEUIINFO MENU FILES TREE (tree) 
#define GNOMEUIINFO MENU WINDOWS TREE (tree) 
#define GNOMEUIINFO MENU HELP TREE (tree) 
#define GNOMEUIINFO MENU GAME TREE (tree) 


Sc US 使 用 GNOME 宏 来 定义 菜单 

在 本 例 中 ， 我 们 通过 这 些 沫 单 来 看 看 安 是 怎样 工作 的 。 对 menul.c 
做 如 下 改动 ， 并 将 它 保存 为 menu2.c (为 简单 起 见 ， 本 例 中 的 菜单 选择 
没有 定义 回调 函数 。 本 例 只 是 为 了 说 明 GNOME 荣 单 宏 的 便利 ) 。 


static GnomeUIInfo editmenu[] ( 
GNOMEUIINFO MENU FIND ITEM (NULL, NULL), 


GNOMEUTINFO END 


it 7E menu2.c H fs FjlibgnomeuiZ , 极 大 地 减少 了 需要 输入 的 代 
码 量 ， 并 使 菜单 代码 更 容易 理解 了 。 这 些 宏 不 仅 季 省 了 开发 者 时 间 和 
精力 ， 还 有 助 于 创建 菜单 并 使 菜单 的 字体 、 键 盘 快 捷 方式 和 图 标 与 其 


他 GNOME 程 序 保持 一 致 e 在 程序 开发 中 ， 我 们 应 该 尽 可 能 多 地 使 用 
JUSTE o 

16-13 显示 了 menu3.c 的 运行 情况 ， 它 拥有 一 个 标准 化 的 
GNOME ŽI] e 


m Menus, menus, menus 
late Edit 


Save As... Shift+Ctd+s 


€] Quit ctH+Q 


图 16-13 


16.8 iste 


GUI 应 用 程序 的 一 个 重要 组 成 部 分 加 是 与 用 户 交 互 并 通知 用 户 重 
要 的 事件 。 通 党， 你 会 为 此 创建 一 个 临时 的 带 有 OK 和 Cancel 按 钮 的 窗 
口 。 如 采信 息 非 常 重 要 , 它 需 要 一 个 立即 啊 应 〈 如 删除 一 个 文件 ) ， 你 
忠 布 望 能 够 阻止 用 户 访 问 任 何其 他 窗口 ， 直 到 他 做 出 了 一 个 选择 (这 
类 窗口 被 称 为 模式 对 话 框 ) 。 

我 们 在 这 里 讲述 的 就 是 对 话 框 。GTK+ 提 供 了 一 个 从 GtkWindow 派 
生 的 特殊 对 话 框 构件 ， 可 以 让 编程 变 得 更 加 容易 。 


16.8.1 GtkDialog 


正如 你 所 看 到 的 ，GtkDialog 是 GtkWindow 的 一 个 子 类 ， 因 此 它 继 
承 了 GtkWindow 的 所 有 函数 和 属性 : 


GtkWindow 
+----GtkDialog 


GtkDialog 将 窗口 分 为 两 个 区 域 ， 一 个 放 构 件 的 内 容 ， 一 个 放 底 部 
的 按钮 。 你 可 以 在 创建 对 话 框 时 指定 你 想 要 的 按钮 和 其 他 对 话 框 设 
HE 


GtkWidget* gtk dialog new with buttons (const gchar *title, 
GtkWindow *parent, 
GtkDialogFlags flags, 
const gchar *first button text, 


这 个 画 数 创建 了 一 个 完整 的 带 有 标题 和 按钮 的 对 话 框 窗 口 。 第 二 
个 参数 parent 应 指 同 应 用 程序 的 主 窗口 ， 这 样 GTK+ 才 可 VL Ge ERE 
是 一 直 连 接 到 主 窗口 的 。 当 主 窗口 被 最 小 化 时 ， 它 也 会 跟着 最 小 化 。 

flags 参 数 决定 了 对 话 框 可 以 拥有 的 属性 组 合 : 

O GTK_DIALOG_MODAL: 

O GTK DIALOG DESTROY WITH, PARENT: 

O GTK DIALOG NO SEPARATOR ° 

你 可 以 将 这 些 标 记 用 按 位 或 操作 符 组 合 起 来 ， 例 如 ， 

(GTK_DIALOG_MODALIGTK_DIALOG_NO_SEPARATOR) 既是 一 


1 sm 又 是 一 个 在 主 窗 口 区 域 和 按钮 区 域 之 间 没 有 分 割 线 的 
对 话 框 。 

其 余 的 参数 是 一 个 以 NULL 结 尾 的 按钮 和 相应 的 响应 代码 列表 。 
你 将 在 后 面 看 到 gtk_dialog_run 范 数 时 明白 响应 代码 的 含义 。 通 常 ， 你 
ee 这 些 按 钮 中 也 有 定义 好 
ZR o 

下 面 显示 了 创建 一 个 带 有 OK 和 Cancel 按 钮 的 对 话 框 的 代码 ， 它 会 
根据 按 下 的 按钮 分 XU 返回 GTK RESPONSE ACCEPT 和 
GTK RESPONSE REJECT: 


我 们 在 这 里 选择 创建 两 个 按钮 ， 但 是 对 话 框 并 没有 限制 可 以 放置 
的 按钮 数目 。 此 外 ， 你 可 以 从 一 组 响应 类 型 标记 中 进行 选择 。accept 
和 reject 标 记 没 有 被 标准 GNOME 使 用 ， 因 此 你 可 以 随意 在 应 用 程序 中 
使 用 它们 ( 记 住 ， 在 你 的 应 用 程序 中 ，accept 应 意味 着 接受 ) 。 其 他 
在 这 里 可 以 使 用 的 标记 包括 OK 和 CANCEL, 具 体 请 见 下 一 节 中 的 
GtkResponseType 枚 举 类 型 。 

当然 ， 你 需要 同 对 话 框 中 添加 内 容 ， 这 个 GtkDialog 包 含 一 个 现成 
的 GtkVBox 来 容纳 构件 。 你 直接 从 这 个 对 象 获 得 一 个 指针 : 


GtkWidget *vbox = GTK_DIALOG(dialog) ->vbox; 


你 以 通常 的 方式 使 用 这 个 GtkVBox, 比 如 通过 gtk_box_pack_start 或 
者 其 他 类 似 的 函数 。 

一 旦 创建 好 一 个 对 话 框 ， 下 一 步 束 是 将 它 展 现 给 用 户 ， 并 等 待 响 
应 。 这 可 以 使 用 下 面 两 种 方法 来 完成 : 一 种 是 模式 的 方法 ， 它 阻止 除 
对 话 框 以 外 的 一 切 输入 ; 一 种 是 非 模 式 的 方法 ， 它 像 对 每 其 他 窗口 一 
样 对 得 对话 框 。 让 我 们 先 看 看 运行 一 个 模式 对 话 框 。 


16.8.2 ION 


模式 对 话 框 强制 用 户 首 先 啊 应 ， 然 后 才能 进行 任何 其 他 动作 。 它 
对 以 下 这 些 情况 很 有 用 : 用 户 将 要 做 一 件 有 严重 后 果 的 事情 ， 或 报告 
错误 和 警告 信息 。 

你 可 以 通过 设置 GTK_DIALOG MODAL 标记 和 调用 
gtk_widget_show 芳 数 ， 使 一 个 对 话 框 变 为 模式 对 话 框 。 但 还 有 一 个 更 


好 的 方法 。gtk_dialog 一 run 通 过 阻止 程序 的 进一步 执行 ， 直 到 一 个 按 
钮 被 按 下 ， 来 帮 你 解决 这 个 难题 。 

当 用 户 按 下 一 个 按钮 (或 者 对 话 框 被 关闭 ) 时 ，gtk_dialog_run 返 
回 一 个 int 类 型 的 结果 来 表明 用 户 按 下 了 哪个 按钮 。GTK+ 通 常 定义 一 
个 枚 举 类 型 来 描述 可 能 的 值 : 

typedet enum 
{ 
GTK RESPONSE NONE = -1, 
GTK RESPONSE REJECT = -2, 
GTK RESPONSE ACCEPT = -3, 
GTK RESPONSE DELETE EVENT - -4 


GTK RESPONSE OK = -5, 
GTK_RESPONSE_CANCEL = -6, 
GTK_RESPONSE_CLOSE = -7, 
GTK_RESPONSE_YES = -8, 
GTK_RESPONSE_NO = -9, 
GTK_RESPONSE_APPLY = -10, 
GTK_RESPONSE_HELP = -11 


} GtkResponseType; 


现在 我 们 可 以 解释 传递 给 gtk 一 dialog_new_with_buttons 的 结果 代 
码 了 。 结 果 代 码 是 在 按钮 被 按 下 时 ，gtk_dialog_run 返 回 的 一 个 
GtkResponseType 值 。 如 果 对 话 框 被 关闭 (例如 用 户 点 击 了 关闭 
标 ) ， 你 将 得 到 一 个 GTK_RESPONSE_NONE 的 结果 。 
switch 结 构 非常 适合 于 执行 这 个 逻辑 流程 : 
GtkWidget *dialog = create_dialog(); 
int result = gtk dialog run(GTK, DIALOG(dialogl]; 


switch (result) 


case GTK RESPONSE, ACCEPT: 
delete filel); 
break; 

case GTK RESPONSE REJECT: 
do, nothing(); 
break; 

default: 


dialog_was_cancelled (); 
break; 

) 

gtk widget destroy (dialog); 
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的 ， 这 不 需要 你 花费 多 少 精力 或 编写 多 少 代 码 。 最 后 你 只 需 用 
gtk_widget_destroy 进 行 清理 。 

但 当 你 需要 一 个 非 模式 对 话 框 时 ， 事 情 丈 不 是 那么 简单 了 。 你 不 
能 使 用 gtk_dialog_run, 而 是 必须 将 对 话 框 的 按钮 与 回调 函数 连接 。 


16.8.3 OV 


你 已 看 到 如 何 用 gtk_dialog _ run 来 创建 一 个 模式 (阻塞 ) 对 话 框 
了 。 非 模式 对 话 框 的 工作 方式 稍 有 不 同 ， 尽 管 它 们 是 用 同一 种 方法 创 
建 的 。 你 不 是 调用 gtk dialog run, 而 是 将 一 个 回调 函数 连接 到 
oo “response” 信 号 〈 这 个 信号 在 按钮 被 按 下 或 窗口 被 关闭 时 


将 回调 函数 连接 到 信和 号 是 按 通常 的 方式 来 完成 的 ， 但 有 一 点 不 
同 : 回调 函数 有 一 个 额外 的 response 参 数 ， 它 起 着 和 gtk 一 dialog_run 返 
ne e 下 面 的 代码 片断 显示 了 一 个 非 模式 对 话 框 的 基本 用 
lE: 


非 模式 对 话 框 会 致使 复杂 度 增 加 ， 因 为 用 户 没 有 被 强制 立即 啊 应 
对 话 框 ， 他 可 以 最 小 化 对 话 框 并 将 它 环 掉 。 你 需要 考虑 ， 如 采用 户 在 
关闭 第 一 个 对 话 框 之 前 又 试图 第 二 次 打开 这 个 对 话 框 时 ， 你 该 如 何 
做 。 你 要 做 的 就 是 检查 对 话 框 指针 是 否 为 NULL, 如 采 不 是 瓯 调 用 
gtk_window_present 来 重新 显示 已 存在 的 对 话 框 。 你 可 以 在 本 章 最 后 一 
节 中 看 到 它 的 实际 使 用 情况 。 


16.8.4 GtkMessageDialog 
对 于 非常 简单 的 对 话 框 来 说 ， 即 使 GtkDialog 也 显得 过 于 复杂 了 了: 


GtkDialog 
+----GtkMessageDialog 


通过 使 用 GtkMessageDialog, 你 仅 用 一 行 代码 就 可 以 创建 一 个 消息 
对 话 框 。 
GtkWidget* gtk message dialog new (GtkWindow *parent, GtkDialogFlags flags, 
GtkMessageType type, 
GtkButtonsType buttons, 
const gchar *message forzat, 
“eo? 
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框 。 参 数 type 根 据 对 话 框 的 目的 设置 它 的 图 标 和 标题 ， 例 如 ， 和 警告 类 
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GTK. MESSAGE INFO; 
GTK. MESSAGE. WARNING; 
GTK. MESSAGE QUESTION; 
GTK. MESSAGE ERROR ° 

你 还 可 以 选择 一 个 GTK_MESSAGE_ OTHER 值 ， 它 用 于 前 述 对 话 
框 类 型 都 不 适用 的 情况 。 对 于 GtkMessageDialog, 你 可 以 传递 一 个 
GtkButtonsType 而 不 是 分 别 列 出 每 个 按钮 ， 如 表 16-4 所 示 。 


表 16-4 


CtzButtonsType P] yI 


[] D) DJ LI 


OK (AL) Met 
Cle CX WD. Iul 
Cancel (RL) PEL 
Yea Noffi fi] 

OK SiCancel C 09 


MS NOE k rct 
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M ^ 在 本 例 中 ， 我 们 询问 用 户 是 否 确实 要 删除 一 个 文 


itkWidget *dialog * gtk measagse dialog n 


GTK BUTTONS YES NO 

"Are you sure you wish to delete ta?" 
filename]: 

result = gtk dialog run IOTK_ DIALOG 
gtk widget destroy (dialogi: 


这 个 对 话 框 如 图 16-14 所 示 。 


log 


Q. Are you sure you wish to delete important.txt? 


Lem ]| er | 


图 16-14 


GtkMessageDialog 是 传递 信息 或 询问 yes/mo 类 型 问题 的 最 简单 方 
法 。 你 将 在 下 一 广 为 CD 应 用 程序 创建 GUI 时 用 到 它 。 


16.9 CD VH 


在 前 面 的 章节 中 ， 你 用 MySQL 和 C 语 言 接口 开发 了 一 个 CD 数据 库 
应 用 程序 。 现 在 你 将 看 到 ， 用 GNOME/GTK+ 给 该 程序 创建 一 个 GUI 前 
端 是 多 么 容易 ， 开 发 一 个 丰富 的 用 户 界 面 是 多 么 快捷 。 


就 像 第 8 章 中 的 CD 数据 库 应 用 程序 的 需求 一 样 ， 为 运行 本 章 
中 的 CD 数据 库 应 用 程序 ， 你 必须 安装 好 了 MySQL 数 据 库 和 
MySQL 开 发 库 。 


为 了 简明 起 见 ， 你 将 开发 一 个 基础 的 、 骨 以 式 的 用 户 界 面 ， 它 仅 
实现 应 用 程序 的 部 分 功能 。 例 如 ， 你 不 允许 往 CD 里 增加 曲目 信息 或 从 
CD 里 删除 曲目 信息 。 你 将 在 这 个 应 用 程序 里 看 到 本 章 所 介绍 的 构件 的 
ee 这 样 你 就 可 以 了 解 它 们 在 现实 情况 中 是 如 何 使 用 的 


你 将 实现 的 主要 功能 有 : 
通过 GUI 登录 数据 库 ; 
查找 CD; 
显示 CD 和 曲目 信息 ; 
回 数据 库 中 增加 一 张 CD 
创建 一 个 “关于 ” (About) 窗口 ; 
OD 在 用 户 退 出 时 进行 确认 。 
你 把 代码 分 为 3 个 源 文 件 ， 它 们 共享 同一 个 头 文件 
cdapp_gnome.h。 源 文件 将 把 创建 窗口 和 对 话 框 的 函数 界面 生成 函 
数 与 回调 函数 分 开 。 


OOOOd 


实 验 cdapp_gnome. h 
移 来 看 看 cdapp_gnome.h， 它 声明 了 那些 你 需要 实现 的 函数 。 
(1) 包含 GNOME 头 文件 和 你 在 第 8 章 中 开发 的 接口 国 数 所 对 应 
的 头 文 件 。 这 个 示例 程序 使 用 了 第 8 章 中 的 app_mysqlLh 文 件 和 
app_mysq1.c 文 件 ， 以 及 该 章 中 创建 的 数据 库 。 


#include <gnome.h> 
#include "app mysql.h" 


( 2) 枚 举 类 型 标记 了 GtkTreeView 构 件 的 列 ， 你 将 用 GtkTreeView 
enum { 
COLUMN_TITLE, 
COLUMN_ARTIST, 
COLUMN_CATALOGUE, 
N_COLUMNS 
}; 


(3) 在 interface.c 文 件 中 有 3 个 窗口 创建 函数 : 


GtkWidget *create main windcwi): 
GtkWidget *create login aialogf); 


(4) SEXESERURL - LEURS «ots HET ANd zc HERO TE RE 
callbacks.c 文 件 中 : 


/* Callback to quit applicatica */ 
void quit app| GtkWidget * window, gpoínter data]: 


/* Callbeck useful for confirming exit before quitting */ 
gboolean delete event handler | GtkWidget *window, GdkBvent ‘event, gpointer data); 
/* Callback connected to ‘response’ signal of added dialog *; 


void added dialog button clicked (GrkDialog * dialog, gint response, 
gpointer userdata): 


/* Callback for menu and toolbar ‘Add CD' button */ 
void on addcd activate (GtkWidget "widget, gpointer user data); 


/* Callback for menu ‘About’ button *,/ 
void con About activate (GtkWidget ‘widget, gpointer user_data); 


/* Callback for search button */ 
void on search button clicked (GtkWidget *widget, gpointer userdata]: 


Am 


实 验 interface.c 

接着 ， 首 先 来 看 一 下 interface.c， 该 文件 定义 了 你 在 应 用 程序 中 使 
用 的 窗口 和 对 话 框 。 
(1) 首先 是 在 callbacks.c 和 main.c 中 引用 的 一 些 构 件 指 针 : 


#include "app gnome.h* 


GtkWidget *treeview: 
GtkWidget *appbar; 
GtkWidget *artist entry; 
GtkWidget *title entry; 
GtkWidget *catalogue entry: 
GtkWidget *username entry; 
GtkWidget *password, entry! 


(2) app 是 一 个 具备 文件 作用 域 的 主 窗口 指针 : 


static GtkWidget *app; 


ge oe OPUS BRIM, “EEN i ATS RE SAN SERRA TES JIH 


void add widget with label | GtkContainer *box. gchar ‘caption, GtkWidget *widget) 
i 


GrkWidget *label = gtk iabel new (caption): 
GtkWidget *hbox = gtk hbox new (TRUE, 4) 


gtk_container_sdd(GTK_CONTAINER (hbox), label); 
gtk.container sddIGTK CONTAINER ihbox), widget): 


gtk container add[box, hbox); 


M an 


static GnameUIIn Ftiilemenu 

{ 
GNOMEUIINFO_MENU_WEW_ ITEM {* New cD, NULL, on_added activate, NULL 
GNOMEUIINFO, SEPARATOR 
GNOMEUIINFO MENU EXIT ITEM (close app, NULL). 


SGNOMEUIINFO, END 


static GnomeUIInfo helpeenu[] = 
GNOMEUIINFO MENU, ABOUT ITEM (on about activate, NULL), 
GNOMEUIINFO END 

static OnomeUIInfo menubar i 
GNOMEUIINFO MENU FILE TREE (filemenu), 


SOMBUIINFO MENU, HELP TREE (helpmenu], 
GNOMEUIINFO END 


(5) Er aue [E] EE FP DRE A TARE, WEA, HE 
放置 在 屏幕 中 央 ， 组 装 构成 用 户 界面 的 构件 。 注 意 ， 这 个 画 数 并 未 在 
a diat ta AA HBE ADANE 


GtkWidget bar 
GtkWidget x 
GtkWidget x 
tkWidget - 
Widget *e y 
GtkWidget ar 
tkWidget r low 
tkCeliRen *re indes pr 
app gnom Pp wW m Dat 
gtk. window. pe AK WINDOW! app UTK. WIN POS. CENTER! | 
gtk window set default size | GTK WINDOM| app ], 540, ¿ni 
Grom app. create menus JNOME AP (app mess 


(6) 使 用 GTK+ 自 带 的 图 标 来 创建 工具 \ 栏 ， 并 连接 回调 函数 : 


toolbar = gtk toolbar new |); 
gnome app add toolbar (GNOME APP lapp}, GTK TOOLBAR (toolbar), ‘toolbar’, 
BONOBO DOCK ITEM BEH EXCLUSIVE, 


BONOBO DOCK TOP, 1, 0. 9); 
tk container set border width (GTK CONTAINER (toolbar), 1]; 
gtk toolbar ínsert stock (O7TK TOOLBAR [toolbar], 
*gtk-add', 
"Aad new CD", 
NULL, GTK.SIGNAL.FUNC [on.addcd activate), 
NULL, -1; 
gtk toolbar insert space (GTK TOOLBAR (toolbar). 1); 
gtk toolbar insert stock (GTK TOOLBAR [toolbar], 
*gtk-quit", 
‘Quit the Application", 
NULL, GTK SIGNAL PUNC [on quit activate), 
NULL, -1): 


(7) 创建 用 于 搜索 CD 的 构件 : 


label = gtk_label_new(*Search String:*); 
entry = gtk entry new I); 
search button = gtk button new with label|*Search"): 


(8) ”gtk_scrolled_window 提 供 深 动 条 ， 使 构件 (在 本 例 中 是 
GtkTreeView) 可 以 扩展 超出 窗口 的 大 小 : 


scrolledwindow = gtk_scrolled_window_new (NULL, NULL): 

gtk scrolled window set policy (GTK SCROLLED WINDOW (scrolledwindow], 
GTK. POLICY AUTOMATIC, 
OTK POLICY AUTOMATIC| ; 


(9) 接 下 来 ， 像 通常 那样 用 容器 构件 来 排列 界面 元 素 : 


vhox * gtk vbox new (FALSE, 0); 

hbox * gtk hbox new (FALSE, 0); 

gtk box pack start IOTK BOX (vbox)], hbox, FALSE, FALSE, 5): 

gtk box pack start |GTK BOX (hbox), label, FALSE, FALSE, 5); 
gtk.box pack start |GTK, BOX |hbox), entry, TRUE, TRUE, 61; 

gtk box pack start [GTK BOX (hbox)], search button, FALSE, FALSE. 5); 
otk box pack start |GTK BOX (vbox), scrolledwindow, TRUE, TRUE, 0); 


(10) 然后 创建 GtkTreeView 构 件 ， 增 加 3 列 ， 并 将 其 放 在 
GtkScrolledWindow#: 


treeview = gtk_tree_view_new!); 

renderer = gtk cell renderer text new (); 

Gtk *ree view insert column with attributes (GTK TREE VIEW|treeview), 
COLUMN TITLE, 
*Title*, renderer, 
*text*, COLUMN TITLE, 
NULL) ; 

gtk tree view insert column with attributes (GTK TREE VIEW|treeview), 
COLUMN ARTIST, 
"Artist", renderer, 
*text*, COLUMN ARTIST, 
NULL) 3 

gtk tree viow insert column with attributes (GTK, TREE VIEW(treeview), 
COLUMN, CATALOGUE, 
*Catalogue', renderer, 
"text", COLUMN CATALOGUE, 


NULL) 


gtk tree view set search column (GTK_TREE VIEW (treeview) 
COLUMN TITLE! : 


gtk conteiner adi [GTK CONTAINER (scrolledwindow treeview):! 


(11) 最 后 ， 设 定 主 窗 口 的 内 容 ， 增 加 一 个 GnomeAppbar， 并 连 
接 必 要 的 回调 函数 : 


&ppbar = gnome appbar new (FALSE, TRUE, GNOME_PREFERENCES_NEVER) ; 
gnome app.set statusbar (GNOME APP (app), appbar 


gnome app install menu hints {GNOME_LAPP (app), menubar) 


g.signal connect (GTK OBJECT [search but 
GT7K SIGNAL FUNC (o 


entry): 


on), *clicked*, 


t 
on search botton clicked], 


g.signal connect [GTK OBJECT|app], "delete event" 


GTK SIGNAL FUNC ( delete event handler 
NULL} ; 

g.signal connect (GTK OBJECT|app)], "'"dentroy" 
GTE SIGNAL FUNC ( quit.app ), NULL); 


return app; 
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加 一 张 新 的 CD。 它 包括 艺术 家 、 标 题 和 类 别 的 输入 杠 ， 以 及 OK 和 
Cancel 按 钮 : 


GtkWidget ‘create added dialogi) 
( 


artist entry = gtk_entry_new(!); 
title entry = gtk_entry_new!): 
catalogue entry = gtx_entry_new!); 


GtkWidget *dialog = gtk dialog new with buttons ("Add cn", 
app, 
GTK DIALOG DESTROY WITH PARENT, 


nk. 


oF 


GTK_ZES ACCEPT, 
GTK_STOCK_CANCEL, 
GTK RESPONSE REJECT, 


NULL): 


add widget with label | GTK CONTAINER (GTK DIALOG {dialog} ->vbox), 
"Artist", artist entry]: 

add widget with label | GTK,CONTAINES |GTK DIALOG [dislog|-»vbox), 
‘Title’, title entry}: 

add widget witb label | GTK_CONTAINER (OTK DIALOG {dialog} ->vbox) 
Catalogue’, catalogue entry 


g.signal connect 


retum dialog; 


(13) 用 户 在 查询 数据 库 之 前 需要 先 登 录 数 据 库 。 下 面 这 个 函数 
创建 一 个 对 话 框 ， 用 于 输入 用 户 名 和 和 密码 : 


实 验 callbacks.c 
文件 callbacks.c 包 含 用 于 UI 构件 的 回调 函数 定义 。 
(1) 首先 ， 需 要 包含 头 文 件 和 引用 一 些 在 interface.c 中 定义 的 全 
局 变量 ， 这 样 你 束 可 以 读 取 和 更 改 某 些 构件 的 属性 了 : 


jt eid 


(2) 在 quit_app 中 ， 调 用 database_end 在 退出 前 做 清理 工作 并 关闭 
数据 库 : 


pr GtkWidget “window Jp 


(3) 接 下 来 的 函数 弹出 一 个 简单 的 对 话 框 ， 用 于 确认 你 是 否 想 要 
退出 应 用 程序 ， 并 返回 一 个 gboolean 类 型 的 啊 应 : 


(4) delete_event_handler 是 一 个 与 主 窗口 的 Gdk 删 除 事件 相连 接 
的 回调 函数 。 这 个 事件 在 你 试图 关闭 窗口 时 发 送 ， 但 它 位 于 
GTK+destroy 信 号 发 出 之 前 。 


firm exit | 


(5) 下 一 个 函数 在 用 户 点 击 增 加 CD 对 话 框 中 的 按钮 时 被 调用 。 
如 果 上 点击 了 OK 按钮 ， 程 序 将 字符 串 复 制 到 一 个 非 const 的 字符 数组 
中 ， 并 将 其 中 的 数据 传递 给 MySQL 的 接口 函数 add_cd: 


(5) F —TP IS XLI P" erit inca i& Hep fff HH WEOUH. Gu ecd; FOR Fig I 
"E. E OE rU, FRO A Ri MySQL Pk E18 t 


(6) 这 是 整个 应 用 程序 的 核心 部 分 : 获取 搜索 结果 ， 并 填充 
GtkTreeView ° 


re 


(7) 你 从 输入 框 构件 中 得 到 搜索 字符 串 ， 将 其 复制 到 一 个 非 
const 的 变量 中 ， 然 后 获取 匹配 CD 的 ID: 


(8) 接着 ， 更 新 appbar 来 显示 一 条 消息 ， 通 知 用 户 搜 索 结果 : 


(9) 现在 你 得 到 了 搜索 结果 ， 可 以 用 它 来 填充 GtkTreeStore T ° 
对 每 个 CD ID， 你 需要 获取 其 对 应 的 current_cd_st 结 构 〈 这 个 结构 包含 
了 CD 的 标题 和 作曲 家 信息 ) ， 然 后 获取 其 曲目 列表 。 还 要 限制 CD 条 
目的 总 数 不 超过 app_mysqlLh 中 定义 的 MAX_CD_RESULT 值 ， 来 确保 
GtkTreeStore\ 2 fin Hi ° 


COLUMN 


res2 = get.cd[cd res.cd id[i], cå}; 


/* Add a new row to the model */ 
gtk tree mtore append [tree store, &parent iter, NULL); 
gtk tree store ser [tree store, &parent iter 
COLUMN, TITLE, cd.title, 
COLUMN ARTIST, cd.artist name, 
COLUMN CATALOGUE, cd.catalogue. -1 


res} = get cd tracks(ci res.cd id[ie«], sot); 

j*9 

/* Populate the tree with the current cd's tracks */ 
while (j < res3) 

{ 


sprintf(ttack eitle, * Track 3d. *, jell; 
gtrcat(track title, ct.track[je*]): 


gtk tree store append [tree srore, &child iter, &parent iter]; 
gtk tree store set (tree store, &child iter. 
COLUMN.TITISZ, track title, -11; 
) 
) 


gtk tree_view_set_model (GTK TREE VIEW (treeview), GTR TREE MODEL|trzee store)]; 


(10) addcd 对 话 框 是 非 模式 的 。 因 此 ， 你 需要 在 创建 和 显示 它 之 
前 先 检查 它 征 否 已 存在 : 


void on .addcd activate (GtkMenulter * menuitem, gpoinrer uwer data 
{ 
if (addcd dialog 1= NULL) 
return: 


addcd dialog = create addcd dialog!!; 
gtk widget show All (addcá dialog); 


} 


gboolean close app | GtkWidget * window, gpointer date) 
{ 
gboolean exit; 


if ((exit = confirm exitíi]) 
t 
quit_app (NULL, NULL): 
) 
return exit; 


(11) 当 点 击 About 按 钮 时 ， 一 个 标准 的 GNOME about (关于 ) 
窗口 将 弹出 : 


void on about activate (GtkMenultem * menuitem, gpointer user data) 
{ 
const char * wuthorsi[] = ("Wrox Press", NULL); 
GtkWidget *about = gnome abogt new (*CD Database", *1.0*, 
*(cl Wrox Press*, 
"Beginning Linux Programming", 
(const char ** | authors, NULL, 
"Translators*, NULL); 
gtk widget show|about!: 


实 验 main.c 
输入 下 面 代码 ， 将 它 命 名 为 main.c， 它 包含 这 个 程序 的 main EN 
2 o 


(1) 在 include 语 句 之后， 你 引用 在 interface.c 中 定义 的 用 户 和 名 和 
密码 输入 构件 : 


(2) 像 通常 一 样 初始 化 GNOME 库 ， 然 后 创建 并 显示 主 窗口 和 登 
录 对 话 框 : 


(3) 程序 不 断 循环 ， 直 到 用 户 输入 了 一 个 正确 的 用 户 名 和 密码 。 
h 以 通过 点 击 Cancel 按 钮 退出 ， 此 时 程序 会 询问 他 是 否 确认 这 个 
ae o 


o (4) 如 果 database_start 失 败 ， 它 将 显示 一 条 错误 信息 ， 并 重新 显 
示 登 录 对 话 框 ; 


(5) 你 将 编写 一 个 makefile 文 件 来 编译 这 个 应 用 程序 。 和 第 8 章 中 
一 样 ， 你 可 能 需要 添加 mysqlclient 库 的 路 径 ， 如 下 所 示 : 
-L/usr/lib/mysql 
在 -L 之 后 指定 你 的 系统 中 放置 MySQL 库 的 目录 。 


(6) 现在 只 需 使 用 make 命 令 来 编译 这 个 CD 应 用 程序 即 可 : 
make -f Makefile 
| 运行 app， 你 将 会 看 到 一 个 GNOME 风格 的 CD 应 用 程序 (如 图 16- 
15) e 


CU Database 


Artist Catalogue 
b Dark Side of the Moon Pink Floyd 8000024D4P 
w Wih You Were Here Pink Floyd 8000024045 
Wack L Shine on you crazy Somond 


Track 23. Have d cigar 
Track 4. Wish you were here 
Tack 5. Shine on you crazy diamond pt.2 


Displaying 2 result(s) for search string * Pink * 
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16.10 ”小结 


在 本 章 中 ， 你 学 习 了 如 何 用 GTK+/GNOME 库 来 编写 具有 专业 界 
面 外 观 的 GUI 应 用 程序 。 首 先 ， 你 了 解 了 X 视 窗 系统 以 及 工具 包 是 如 何 
与 之 相 适 应 的 ， 然 后 简要 了 解 了 GTK+ 及 其 对 象 系统 和 信和 号 /回调 函数 
机 制 是 如 何 运 作 的 。 

接着 ， 你 开始 学 习 GTK+ 构 件 的 API 画 数 ， 我 们 通过 一 些 程序 展示 
了 其 或 简单 或 高 级 的 实际 使 用 情况 。 在 学 习 GnomeApp 构 件 时 ， 你 看 
到 通过 辅助 宏 创建 菜单 是 多 勾 容易 。 最 后 ， 你 学 习 了 如 何 创建 模式 和 
韭 模 式 对 话 框 来 与 用 户 进 行 交互 。 

在 本 划 的 最 后 ， 你 为 CD 数据 库 创建 了 一 个 GNOME/GTK+ 的 
GUI， 你 可 以 通过 它 登 录 数 据 库 、 搜 索 CD， 以 及 问 数 据 库 中 增加 
CD ° 

在 第 17 章 中 ， 你 将 看 到 GTK+ 的 竞争 者 Qt， 并 学 习 如 何 使 用 Qt 来 
编写 KDE 程 序 。 


第 17 章 ”用 Qt 进行 KDE 编 程 


在 第 16 章 中， 你 学 习 了 在 X 环 境 下 使 用 GNOME/GTK+GUI 库 来 
创建 图 形 用 户 界 面 。 但 并 非 只 能 使 用 那些 库 来 开发 GUI，Linux 的 GUI 
领域 中 的 另 一 大 主角 是 KDE/Qt。 在 本 章 中 ， 你 将 会 学 习 这 些 库 ， 并 看 
到 它们 是 怎样 在 与 GNOME/GTK+ 的 竞争 中 发 展 的 。 

Qt 是 用 C++ 语言 编写 的 ，C++ 也 是 编写 QUVKDE 程 序 的 标准 语言 。 
因此 在 本 章 中 ， 你 必须 把 注意 力 从 你 熟悉 的 C 语 言 转移 到 C++ 语言 上 
来 。 你 也 可 借 此 机 会 重 温 一 下 C++ 语言 ， 特 别 是 回顾 一 下 派生 、 圭 
装 、 方 法 重 载 和 虚 函 数 的 基本 原理 。 

本 章 我 们 将 介绍 以 下 内 容 : 

Qt 简介 

安装 Qt 

开始 编程 

fe RIP Lr 

Qt 构件 

Qt 对 话 框 

KDE 环 境 下 的 荣 单 和 工具 栏 

使 用 KDE/Qt 创 建 CD 数 据 库 应 用 程序 


[] DJ EJ P1 DJ FE EI DI 


17.1 KDE 和 Qt 简介 


KDE (K# MAG) 是 一 个 基于 Qt GUI 库 的 开源 桌面 环境 。KDE 
中 包含 了 大 量 的 应 用 程序 和 工具 ， 其 中 包括 一 整套 办 公 套 件 、 一 个 
Web 浏 览 器 ， 甚 至 还 有 一 个 功能 齐全 的 KDE/Qt 应 用 程序 集成 开发 环境 
( 即 在 第 9 章 中 介绍 的 KDevelop) 。 当 苹果 公司 选用 KDE 的 Web 浏 览 絮 
作为 Mac OS X 的 主要 Web 浏 览 器 Safari (被 认为 是 最 快速 的 浏览 器 ) 的 
核心 时 ， 业 界 才 发 现 KDE 的 程序 有 多 先进 。 
KDE 项 目的 主页 是 http://www.kde.org， 在 那里 你 可 以 了 解 它 的 更 
多 信息 、 下 载 KDE 和 KDE 应 用 程序 、 碍 找 文档 、 加 入 邮件 列表 ， 以 及 
了 解 其 他 开发 者 的 信息 。 


在 写作 本 书 时 ，KDE 的 最 新 版 本 是 3.5.7。 因 为 这 是 当前 Linux 
发 行 版 自 带 的 版 本 ， 所 以 我 们 将 假设 你 已 经 安装 了 KDE 3.5 或 者 
更 高 的 版 本 。 目 前 ， 开 发 人 员 正 在 开发 KDE 的 一 个 主要 升级 版 本 
KDE4.0。 你 也 可 以 下 载 KDE4.0 的 预览 版 。 同 样 地 ，Qt 的 最 新 版 
本 是 4.3， 但 大 多 数 Linux 发 行 版 自 带 的 版 本 是 Qt3， 如 Qt3.3。 本 章 
将 介绍 QT3.3， 因 为 它 是 目前 最 常见 的 一 个 版 本 。 


从 程序 员 的 角度 来 看 ，KDE 提 供 了 许多 KDE 构 件 ， 这 些 构件 通常 
来 源 于 伴随 它们 的 Qt， 但 相 比 功能 增强 了 并 且 也 更 易 使 用 了 。 与 单独 
使 用 Qt 相 比 ，KDE 构 件 提 供 了 与 KDE 桌 面 更 好 的 集成 。 例 如 ， 你 可 以 
进行 会 话 管理 。 

Qt 是 一 个 用 C++ 编 写 的 、 成 熟 的 、 跨 平台 的 GUI 工 具 包 。 它 是 挪 
威 Trolltech 公 司 的 产品 ， 该 公司 为 商业 市 场 开 发 、 销 售 和 支持 Qt 及 Qt 
相关 软件 。Trolltech 着 力 大 肆 宣 传 Qt 的 路 平台 能 力 ， 这 个 能 力 的 确 令 
人 印象 深刻 。Qt 本 身 就 支持 Linux 和 类 UNIX 系 统 、Windows、Mac OS 
X， 甚 至 艇 入 式 平台 ， 这 是 Qt 相 比 其 党争 对 手 的 一 大 苋 争 优势 。 


Qt 有 一 个 可 以 在 手机 上 运行 的 专用 版 本 。 它 的 男 一 个 版 本 可 
以 运行 在 Sharp Zaurus PDA 和 类 似 的 平台 上 。Qt Jambi 还 提供 了 该 
工具 包 的 一 个 Java 版 本 。 


Trolltech 公 司 目 前 以 一 个 对 临时 用 户 和 爱好 者 来 说 非常 高 的 价格 
在 销售 Qt 的 商业 版 本 。 但 值得 庆 邓 的 是 ，Trolltech 公 司 意 识 到 了 为 目 
由 软件 社区 提供 一 个 免费 版 本 的 价值 。 因 此 ， 它 提供 了 一 个 支持 


Linux ^ Windows Mac OS XBJQUT JU » KIE, TrolltechZ E] tE i 
i ` 一 个 大 型 的 程序 员 社 区 和 对 其 产品 的 高 度 认 
H o 
Qt 开源 版 本 遵循 GPL 许可 证 ， 这 香味 着 你 可 以 用 Qt 库 编 写 程序 ， 

并 且 免 费 发 布 目 己 的 GPL 软件 。 据 我 们 所 知 ，Qt 开 源 版 本 与 Qt 专业 版 
本 之 间 的 两 个 主要 区 别 是 : 前 者 缺乏 支持 以 及 你 不 能 在 商业 应 用 程序 
中 使 用 Qt 软件 。Trolltech 的 网 站 http://www.trolltech.com 上 有 你 需要 的 
所 有 API 文 档 。 


17.2 ”安装 Qt 


除非 你 有 特殊 的 原因 需要 从 源 代 码 开始 编译 ， 否 则 最 好 直接 找 一 
个 针对 你 的 Linux 发 行 版 的 二 进 制 软件 包 或 RPM 包 来 安装 Qt。Fedora 
Linux 7 自 带 了 qt-3.3.8-4.i386.rpm， 你 可 以 用 下 面 的 命令 来 安装 它 : 

$ rpm -Uvh qt-3.3.8-4.1386.rpm 

你 也 可 以 用 软件 包 管 理 器 来 安装 Qt 和 KDE 编 程 库 〈 见 图 17-1) ° 


^ 
fe Yew pelo 
[g Browse CQ Search | E List 


See = 
Desktop Environments € «^ GNOME Software Development ` 
Applications %, © Java Development 


HF 5 KDE Software Development 


Servers 一 
Legacy Software Development 
Base System ~ air c 


stad these packages to develop QT and KDE graphic al or ations 


Y Apply 


如 果 想 自己 下 载 源 代码 并 编译 Qt， 你 可 以 从 Trolltech 公 司 的 FTP 站 
点 ftp://ftp.trolltech.com/qt/source/ 下 载 最 狐 的 源 代码 包 。tar 软 件 包 中 的 
INSTALL 文 件 详细 说 明了 如 何 编译 和 安装 Qt: 


$ tar -xvzf qt-xll-free-3.3.8.tar.gz 
$ ./configure 


你 还 需要 在 /etc/ld.so.conf 文 件 中 添加 如 下 一 行 (该 行 可 以 添加 在 
这 个 文件 中 的 任何 位 置 ) : 


/usr/lib/qt-3.3/lib 


f£ Fedora FI Red Hat Linux 系 统 中 ， 这 行内 容 是 保存 在 文 
件 /etc/ld.so.conf.d/qt-i386.conf. 中 的 。 如 采 你 是 按 图 17-1 所 示 的 方 
式 安 装 的 Qt， 那 么 这 一 步骤 可 以 省 略 ， 因 为 系统 已 经 帮 你 做 好 
Ts 


在 安装 好 Qt 后 ， 环 境 变量 QTDIR 应 被 设置 为 Qt 的 安装 目录 。 你 可 
以 用 如 下 命令 进行 检查 : 
$ echo $QTDIR 
/usr/lib/qt-3.3 

同时 ， 要 确认 lib 目 录 已 被 添加 到 /etc/ld.so.conf 文 件 中 。 

接 下 来 以 超级 用 户 的 身份 运行 如 下 命令 : 
# ldconfig 

dE BGS TT FIX Sei QU, CAPR IRIN Qt AS BE 
TE Lf ° 
x 验 QMainWindow 

输入 这 个 程序 《或 对 下 载 的 代码 进行 复制 、 粘 贴 ) ， 将 其 命名 为 
qt1.cpp: 


finclude «quapplication.h» 
' lude <qmainwindow.h> 


要 编译 这 个 程序 ， 你 需要 包含 Qt 的 include 和 1ib 目 录 : 


$ g++ -o qtl qti.cpp -I$QTDIR/include -L$QTDIR/lib -lqui 


在 某 些 平台 上 ， 上 面 命 令 最 后 的 库 是 -lqt。 不 过 对 Qt3.3 来 
说 ， 应 使 用 -lqui ° 


运行 这 个 程序 ， 你 将 看 到 一 个 Qt 窗口 ( 见 图 17-2) 


实验 解析 

与 GTK+ 不 同 ，Qt 中 没有 一 个 涵盖 一 切 的 qth 头 文件 ， 因 此 你 必须 
明确 包含 对 应 每 个 你 所 使 用 对 象 的 头 文 件 。 

你 遇 到 的 第 一 个 对 象 是 QApplication。 这 是 必须 构造 的 主 Qt 对 象 ， 
你 将 命令 行 参 数 传递 给 它 。 每 个 Qt 应 用 程序 必须 有 且 仅 有 一 个 
QApplication 对象， 而 且 你 必须 在 做 其 他 任何 事 之 前 创建 它 。 
QApplication 负 责 处 理 一 些 底 层 操作 ， 如 事件 处 理 、 字 符 串 本 地 化 和 挖 
制 界 面 外 观 等 。 

上 述 使 用 了 两 个 QApplication 的 方法 : 一 个 是 setMainWidget， 它 
设置 应 用 程序 的 主 构件 ， 男 一 个 是 exec， 它 启动 事件 循环 。exec 将 一 
直 运 行 ， 直 到 QApplication::quitO 被 调用 或 主 构件 被 关闭 。 

QMainWindow 是 一 个 Qt 基础 窗口 构件 ， 它 支持 菜单 、 工 具 栏 和 状 
en PEN 以 及 为 其 添加 构件 以 创建 一 个 用 
接 下 来 ， 我 们 将 介绍 事件 张 动 编程 的 机 制 ， 你 将 为 应 用 程序 添加 
一 个 PushButton 构 件 。 


17.3 fe T 


正如 你 在 第 16 章 中 所 看 到 的 ， 信 号 和 信和 号 处 理 是 GUI 应 用 程序 用 
来 啊 应 用 户 输入 的 主要 机 制 ， 也 是 所 有 GUI 库 的 核心 特征 。Qt 的 信号 
处 理 机 制 由 信号 (signal) IS (slot) 构成 ， 它 们 相当 于 GTK+ 中 的 信 
号 和 回调 函数 ， 或 者 Java 中 的 事件 和 事件 句柄 。 


注意 ，Qt 售 号 与 第 11 章 中 讨论 的 UNIX 信 和 号 是 完全 不 同 的 两 个 


这 里 再 回顾 一 下 事件 驱动 编程 的 原理 : 一 个 GUI 是 由 沫 单 、 工 具 
兰 、 按 钮 、 输 入 框 和 许多 其 他 GUI 元 素 组 成 的 ， 这 些 元 素 被 统称 为 构 
牛 。 当 用 户 与 一 个 构件 交互 时 ， 例 如 激活 沫 单项 或 者 在 输入 框 中 输入 
一 些 文 本 ， 构 件 将 发 出 一 个 命名 信号 ， 如 clicked 、text_changed 或 
key_pressed。 你 通常 要 对 用 户 的 动作 做 出 啊 应 ， 例 如 保存 一 个 文档 或 
退出 应 用 程序 。 你 通过 把 一 个 信号 连接 到 一 个 回调 函数 (在 Qt 的 说 法 
中 ， 是 一 个 槽 ) 来 做 到 这 一 点 。 

在 Qt 中 使 用 信号 和 槽 的 方法 比较 特别 ，Qt 定 义 了 两 个 新 的 很 贴切 
的 伪 关 键 字 (signals 和 slots) ， 它 用 这 两 个 伪 关 键 字 来 标识 代码 中 类 
的 信号 和 构 。 这 非常 有 利于 增强 代码 的 可 读 性 和 可 维护 性 ， 但 它 也 意 
味 着 ， 代 码 必 须 经 过 一 个 单独 的 预 一 预 处 理 阶 段 (pre-pre 
p oy ， 来 搜索 这 些 伪 关 键 字 并 用 额外 的 C++ 代码 对 它们 进行 替 


SS > 


因此 ，Qt 代 码 并 不 是 真正 的 C++ 代码 。 这 有 时 候 对 某 些 开发 
人 员 来 说 是 一 个 问题 。http:/doc.trolltech.com/ 上 的 Qt 文档 中 包含 
了 使 用 这 些 狐 的 仿 C++ 关键 字 的 原因 。 此 外 ， 信 号 和 槽 的 使 用 与 
Windows 中 的 微软 基础 类 或 MFC 并 没有 什么 不 同 ， 后 者 也 使 用 了 
一 个 C++ 语言 的 修改 定义 。 


Qt 中 信号 和 槽 的 使 用 有 一 些 限 制 ， 但 这 些 限 制 不 是 太 严 重 。 
信号 和 构 必 须 是 QObject 的 派生 类 的 成 员 画 数 。 

如 果 使 用 多 重 继 承 ，QObject 必 须 在 类 列表 中 第 一 个 出 现 。 
在 类 声明 中 必须 出 现 Q_OBJECT 语 句 。 

信号 不 能 在 模板 中 使 用 。 

函数 指针 不 能 用 作 信 号 和 酸 的 参数 。 


口 口 口 口 口 


O 信号 和 槽 不 能 被 履 写 和 提升 为 公共 (public) 方法 。 

因为 你 需要 在 QObject 的 派生 类 中 编写 信号 和 槽 ， 而 且 Qt 基 础 构件 
QWidget 派 生 目 QObject， 所 以 通过 扩展 和 定制 构件 来 创建 界面 是 合 情 
合理 的 。 在 Qt 中 ， 你 几乎 都 是 通过 扩 展 如 QMainWindow 这 样 的 构件 来 
创建 界面 。 

mal sd dE 类 定义 MyWindow.h 如 下 所 示 : 


) OBJECT 


MyWindow 


signals 


该 类 继承 自 QMainWindow， 它 为 应 用 程序 中 的 主 窗口 提供 功能 
类 似 地 ， 当 需要 一 个 对 话 框 时 ， 你 将 创建 一 个 QDialog 的 子 类 。 类 声明 
的 第 一 条 语句 是 Q_OBJECT， 它 充当 一 个 预 处 理 絮 标记 ， 接 下 来 就 是 
通常 的 构造 函数 和 析 构 函数 原型 ， 然 后 是 信号 和 槽 的 定义 。 

你 有 一 个 信号 和 一 个 槽 ， 二 者 均 无 参数 。 要 发 出 一 个 信号 ， 你 只 
需 在 代码 的 某 处 调用 emit: 


emit aSignal(); 


也 就 是 说 ， 其 他 的 所 有 事情 都 是 由 Qt 来 处 理 ， 你 甚至 不 需要 提供 
一 个 aSignal () 的 实现 。 

要 使 用 槽 ， 你 必须 将 它们 连接 到 一 个 信号 。 这 是 通过 QObject 类 中 
的 静态 方法 connect 来 完成 的 : 


bool QObject::connect (const QObject * Gas const char * signal, 
const QObject * receiv const char * member) 


你 只 需 传 递 4 个 参数 : 拥有 信号 的 对 象 (RZE) 、 信 和 号 函数 、 拥 
有 槽 的 对 象 (接收 者 ) ` EF ° 

在 上 面 的 MyWindow 例 子 中 ， 如 果 想 把 QPushButton 构 件 的 dlicked 
信 ee Ten] 以 这 样 写 E. 


注意 E ， 你 必须 用 SA 来 包围 信号 和 槽 函数 。 与 
GTK+ 类 似 ， PEL pe 以 连接 任意 数目 的 槽 ， 一 个 槽 也 可 以 连 
接任 意 数目 的 信号 ， 只 要 多 次 调用 connect 方 法 即 可 。 如 果 连 接 失 败 ， 
它 将 返回 EALSE © o 


" 剩 下 的 事 就 是 实现 槽 函数 ， 它 采用 的 是 一 个 普通 成 员 函 数 的 形 
DN: 


x 验 FSA 

URELZE T ABT ES AY VERSE, TP OI OR EAE 
UE ee ere 然后 把 按钮 的 dicked 信 号 连 
p i 一 个 从。 


(1) 输入 下 面 的 类 声明 ， 把 它 命 名 为 ButtonWindow.h: 


include <qnainwindow. h> 


ndow pub QMa ndow 
OBJECT 

pub 
ButtonWindow[QWidget "parent 0, const char *name 
virtual -ButtonWindowl!; 


private slots: 
void Clicked({); 


(2) 接 下 来 是 类 的 实现 ButtonWindow.cpp: 


finclude "ButtocWindow.moc" 
include «qp 


#include <qapplication,h> 
Sinclude «iostream» 


(3) 在 构造 函数 中 ， 你 设置 窗口 标题 ， 创 建 按 钮 ， 并 且 把 按钮 的 
clicked 信 号 连接 到 模 。setCaption 是 QMainWindow 中 设置 窗口 标题 的 方 
法 : 


ButtonWindow: :ButtonWindow(QWidget *parent, const char 


a name 
; QMainWindow(parent, name 
this-»setCaption|"This is the window Title’ 
QPushButton tton = new OP B ck H ton 
utton->setGeometry (50,30, )) 
onmect (button, SIGNAL (clicked th SLOT 1 


(4) Qt 上 自动 管理 构件 的 析 构 函数 ， 所 以 你 的 析 构 函数 是 空 的 : 


(5) 接 下 来 是 槽 的 实现 代码 : 


void ButtonWindow::Clicked(void) 
{ 

Std::cout << *clicked!\n*, 
) 


(6) 最 后 ， 在 main 函 数 中 ， 你 只 创建 了 ButtonWindow 的 一 个 实 
例 ， 把 它 设置 成 应 用 程序 的 主 窗口 ， 然 后 在 屏幕 上 显示 它 : 


int maan{int argo, char **argv) 
í 
Application applargc, argv); 
ButtonWindew *window = new ButtonWindow i): 


App.setMainWidget (window 
window~->show( 


return app.exec!)]: 


(7) 在 编译 这 个 例子 之 前 ， 你 需要 对 头 文件 运行 预 处 理 程序 。 这 
个 预 处 理 程序 被 称 为 元 对 象 编译 器 (moc) ， 它 位 于 Qt 软件 包 中 。 在 
ButtonWindow.h 上 运行 moc， 将 输出 结果 保存 为 ButtonWindow.moc: 
$ moc ButtonWindow.h -o ButtonWindow.moc 


现在 你 可 以 像 往常 那样 编译 程序 了 ， 将 moc 的 输出 链接 进来 : 


S g++ -o button ButtonWindow.cpp -I$QTDIR/include -L$QTDIR/lib -lqui 


运行 该 程序 ， 你 将 看 到 如 图 17-3 所 示 的 内 容 。 


@ erict) gkayak:/home2/ericfj/writing/Beginning Linux Programming StA Eg/¢ - D. x) 
fle EM View Jerri! Ts Help 


lericf j@hayak chapl? $rc]$ ./buttoa 
clicked! 
clicked! 


0 
C Thísis the window Title ~ c x) 


[Chick Me! | | 


实验 解析 


我 们 在 这 里 引入 了 一 个 新 的 构件 和 一 些 新 函数 ， 下 面 承 对 它们 分 
别 进 行 介绍 。QPushButton 是 一 个 简单 的 按钮 构件 ， 它 有 一 个 标签 和 位 
图 ， 用 户 可 以 通过 使 用 鼠标 点 击 或 按键 盘 来 激活 它 。 

QPushButton 的 构造 函数 很 简单 : 

第 一 个 参数 是 按钮 标签 的 文本 ， 第 二 个 是 父 构件 ， 最 后 一 个 是 由 
Qt 在 其 内 部 使 用 的 按钮 名 字 。 

parent 参 数 是 所 有 QWidget 都 有 的 参数 ， 父 构件 控制 该 构件 什么 时 
候 显 示 和 销毁 ， 以 及 其 他 各 种 特性 。 传 递 NULL 给 parent 参 数 表 示 该 构 
件 是 顶层 构件 ，Qt 将 创建 一 个 空白 窗口 来 包含 它 。 在 本 例 中 ， 你 使 用 
this 为 parent 参 数 传 递 了 当前 的 ButtonWindow 对 象 ， 这 将 把 这 个 按钮 添 
加 到 ButtonWindow 主 区 域 中 。 

name 参 数 设置 构件 在 Qt 内 部 使 用 的 名 字 。 如 果 Qt 遇 到 错误 ， 则 该 
名 字 会 显示 在 输出 的 错误 信息 中 ， 因 此 你 应 该 选择 一 个 合适 的 构件 名 
字 ， 这 样 可 以 在 调试 时 节省 大 量 时 间 。 

你 可 能 已 注意 到 ， 程 序 只 是 很 随便 地 通过 设置 QPushButton 构 造 函 
数 的 parent 参 数 ， 将 QPushButton 添 加 到 ButtonWindow 中 。 它 没有 指定 
构件 的 位 置 、 大 小 、 边 界 或 其 他 类 似 的 属性 。 如 果 想 精确 控制 构件 的 
布局 (这 对 创建 一 个 有 吸引 力 的 用 户 界面 很 关键 ) ， 你 就 必须 使 用 Qt 
的 布局 对 象 。 下 面 就 让 我 们 来 看 看 它 。 

Qt 中 有 很 多 种 方法 可 以 用 来 排列 构件 的 位 置 和 布局 。 你 已 经 看 到 
可 以 通过 调用 setGeometry 来 设置 绝对 坐标 ， 但 这 很 少 使 用 。 因 为 当 调 
整 窗口 大 小 时 ， 构 件 不 会 做 相应 地 调整 来 适应 窗口 。 

排列 构件 的 首选 方法 是 使 用 QLayout 类 或 Box 构 件 ， 在 你 给 出 构件 
的 边 距 值 和 构件 间 的 间距 值 后 ， 它 们 会 根据 情况 目 动 调整 大 小 。 

QLayout 类 和 Box 构 件 之 间 的 主要 不 同 是 : 布局 对 象 不 是 构件 。 

布局 类 派生 自 QObject 而 不 是 QWidget， 因 此 你 在 使 用 它 时 受到 一 
TM 。 比 如 ， 你 不 能 将 QVBoxLayout 作 为 QMainWindow 的 中 心 构 


与 布局 类 相反 ，Box 构 件 (如 QHBox 和 QVBox) 派生 自 QWidget， 
因此 你 可 以 把 它们 看 做 为 普通 的 构件 。 你 可 能 会 奇怪 为 什么 Qt 同时 有 
QLayout 和 QBox 且 两 者 具有 重复 的 功能 。 其 实 QBox 构 件 只 是 为 了 方 
便 ， 本 质 上 它 是 在 一 个 QWidget 中 包含 了 一 个 QLayout。QLayout 具 备 
目 动 调整 大 小 的 优势 ， 而 构件 则 必须 通过 调用 QWidget: 
resizeEvent() 来 手工 调整 大 小 。 

QLayout 的 子 类 QVBoxLayout 和 QHBoxLayout 是 创建 界面 最 常用 到 
的 方法 ， 也 是 你 在 Qt 代码 中 最 常见 的 类 。 


const char* namoe=0 ) 


QVBoxLayout 和 QHBoxLayout 都 是 不 可 见 的 容器 对 象 ， 它 们 分 别 
以 垂直 和 水 平 的 方 同 包含 其 他 构件 和 布局 。 你 可 以 创建 一 个 任意 复杂 
的 构件 排列 ， 因 为 你 可 以 对 布局 进行 内 套 。 例 如 ， 将 一 个 横 同 布局 作 
为 一 个 元 素 放置 到 一 个 纵向 布局 中 。 

下 面 是 我 们 感 兴趣 的 3 个 QVBoxLayout 构 造 画 数 (QHBoxLayout 有 
相似 的 API) : 


QVBoxLayout::QVBoxLayout (QWidget *parent, int margin, int spacing, const char 
*nane) 


QVBoxLayout::QVBoxLayout (QLayout *parentLayout, int spacing, const char * name) 
QVBoxLayout::QVBoxLayout (int spacing, const char *name) 


QLayout HJ parent Æ Zi n] MEE UE l'QLayout ° WÈ 
没有 指定 parent， 那 么 你 以 后 只 过 addLayout 方 法 把 这 个 布局 加 到 
另外 一 个 QLayout 中 去 。 

"i d 党 在 QLayout 四 周 的 边 距 和 构件 间 的 间隔 的 

一 旦 创建 了 QLayout 对 象 ， 你 惑 可 以 用 下 面 两 个 方法 分 别 添加 子 
构件 和 布局 : 


QBoxLayout::addWidget (QWidget *widget, int stretch = 0, int alignment = 0 ) 
QBoxLayout::addLayout (QLayout *layout, int stretch = 0) 


x 4 使 用 QBoxLayout 类 
在 本 例 中 ， 你 通过 在 QMainWindow 中 安排 一 个 QLable 构 件 来 了 解 
QBoxLayout 类 的 实际 使 用 情况 。 
M l) BS, 编写 写 头 文件 LayoutWindow.h: 


class LayoutWindow public QMainWindow 


(2) 然后 ， 编 写 类 的 实现 文件 LayoutWindow.cpp: 


(3) 你 需要 创建 一 个 哑 QWidget 来 容纳 QHBoxLayonut， 


你 不 能 在 QMainWindow 中 直接 增加 QLayonut: 


) 


La 
[ 


int 


b. 


QHidget *widget = new QWidget (this) 
secCenrralWidget (widget): 


QHBoxLayout *horirontal = new QHB8oxLayout(widget, 5, 10, *horizontal*]:; 
QVBoxLayout *verti = new QUBcxLayoutt]; 

QLabel* labell * new QLabeli'Top", widget. "textLabell* | 

QLabel* labei2 = new QLabeli*S3ottos", widget, "'textLabei2"]; 

QLabel* label? = new QLabeli'Rignt"', widget, "'rextLabel?**); 
vertical-»addWidget(labell!; 

vertical-»addWidgert[iasbell]: 

horizontal-»addLayout (vertical): 

horizontal-»addWidget|1abel1); 

resize! 150, 100 ); 


youtWindow::-LayoutNWindow| 


main[int argc, char **argv) 


QApplication applargc,argy); 
LayoutWindow *window = new LayoutWindow(); 


app.setMainWidget (window); 
window-»ashow!: 


return app.exec{); 


像 前 面 一 样 ， 你 需要 在 编译 之 前 在 头 文 件 上 运行 moc: 


§ moc LayoutWindow.h -o LayoutWindow.moc 
5 g++ -o layout LayoutWindow.cpp -ISQTDIR/include -L$QTDIR/lib -lqui 


运行 这 个 程序 ， 你 将 看 到 几 个 QLabel 的 位 置 被 安排 好 了 〈 见 图 17- 
。 试 着 改变 窗口 的 大 小 ， 看 看 标签 怎样 根据 窗口 的 大 小 放大 和 缩 


4) 


小 。 


‘@ Layouts HX 


Top 


Right 


实验 解析 

LayoutWindow.cpp 的 代码 创建 了 两 个 盒 布局 构件 用 于 放置 构件 ， 
DH LER La Ta 3 ERTL ff JR E 。 纵 回 盒 布 局 放置 了 两 个 标 
A ， 分 别 为 Top 和 Bottom ° 横 癌 盒 布 局 也 放置 了 两 个 构件 ， 一 个 是 显 
示 为 Right 的 标签 ， 另 一 个 是 纵 回 盒 布 局 构件 。 ; 你 可 以 像 本 例 中 那样 ， 
随意 地 在 一 个 布局 构件 中 放置 男 一 个 布局 构件 。 

你 可 以 竹 试 修改 LayoutWindow.cpp 中 的 代码 ， 以 便 更 好 地 了 解 盒 
布局 的 工作 原理 。 

我 们 已 经 介绍 了 Qt 的 基本 概念 肖 、moc 和 布局 。 现 在 
是 时 候 进 一 步 讨 论 各 个 构件 了 。 


17.4 Qt 构件 


Qt 中 有 和 针对 各 种 用 途 的 构件 ， 如 采 全 部 讨论 束 会 占用 很 大 的 篇 
幅 。 在 本 市 中 ， 你 将 看 到 一 些 第 见 的 Qt 构件 ， 包 括 : 数据 输入 构件 、 
按钮 、 组 合 框 和 列表 构件 。 


17.4.4 QLineEdit 


QLineEditz Qt] 47 CAS APA o 4 RT DAR ERA Te] SELBE OC 
本 ， 如 用 户 的 名 字 。 在 使 用 该 构件 时 ， 你 可 以 使 用 一 个 输入 掩 码 来 限 
制 输入 以 符合 模板 的 要 求 ， 或 者 为 了 实现 最 终 控制 ， 你 可 以 应 用 一 个 
验证 函数 〈 例 如 ， 为 了 确保 用 户 和 输入 一 个 正确 的 日 期 、 电 话 号 码 或 其 
他 类 似 的 值 ) 。QLineEdit 具 有 编辑 特性 ， 它 允许 你 从 一 个 用 户 的 角度 
或 是 使 用 API 的 角度 来 选择 部 分 文本 、 剪 切 和 粘贴 、 撤 销 、 重 做 等 。 
它 的 构造 画 数 和 最 有 用 的 方法 有 : 


#include «qlineedit.h» 


QLineEdit::QlineEdit (QWidget *parent, const char* name = 0 ) 
QLineEdit::QLineEdit (const QString &contents, QWidget “parent, 
const char *name = 0 ) 
QLineEdit::QLineEdit (const QString &contents, const QString &inputMask, 
QWidget *parent, const char *name = 0 ) 


void setInputMask (const QString &inputMask) 
void insert (const QString &newText ) 

bool isModified (void) 

void setMaxLength (int length) 

void setReadOnly (bool read) 

void setText (const QString &text) 

QString text (void) 

void setEchoMode(EchoMode mode) 


在 构造 函数 中 ， 你 像 往 音 一样 通过 参数 parent 和 name 来 设置 父 构件 
U o 一 个 有 趣 的 属性 是 EchoMode， 它 决定 文本 在 构件 中 的 显示 
zi gs 
它 可 以 取 下 面 3 个 值 之 一 。 
O QLineEdit: : Normal: 显示 输入 的 字符 (ERU) 
O QLineEdit: : Password: 显示 星 号 (用 星 号 来 取代 字符 ) 
O QLineEdit: : NoEcho: 什么 也 不 显示 。 
使 用 setEchoMode 来 设置 模式 : 


lineEdit->setEchoMode (QLineEdit: : Password) ; 


Qt 3.2 引 入 了 一 个 增强 特性 inputMask， 它 按 掩 码 规则 来 限制 输入 。 


inputMask 是 一 个 由 字符 组 成 的 字符 串 ， 其 中 每 个 字符 都 对 应 一 个 
接受 某 个 特定 字符 范围 的 规则 。 如 果 你 熟悉 正则 表达 式 ，inputMask 使 
用 的 原理 与 其 基本 相同 。 

inputMask 字 符 有 了 两 种 类 型 : 一 类 是 表示 某 个 特定 字符 必须 出 现 ， 
男 一 类 指示 如 采 某 个 字符 出 现 ， 它 需要 受到 规则 的 限制 。 表 17-1 显 示 了 
这 些 字符 的 示例 和 它们 的 舍 义 。 


表 17-1 
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inputMaskzé — SHAEF 2H 6r TE — STA BUB] PT AB, AEN DL op 
号 结束 。 还 有 几 个 具有 特殊 含义 的 字符 ， 如 表 17-2 所 示 。 


X 17-2 
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inputMask 中 的 所 有 其 他 字符 在 QLineEdit 中 都 被 视 为 分 隔 符 。 
表 17-3 显 示 了 一 些 掩 码 示例 和 它们 允许 的 输入 。 


表 17-3 
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实 验 QLineEdit 
现在 看 一 下 QLineEdit 的 实际 使 用 情况 。 
(1) 首先 是 头 文件 LineEdit.h: 


finclude <qmainwindow.h> 
finclude «glineedit.h» 
finclude «gsrring.h» 


class LineSdit : public (QMairWindow 
( 
Q OBJECT 


public: 
LineZdit(QWidget *parent = 0, const char *name = 0]; 
QLineEdit ‘password entry: 


private slots: 
void Clicked(): 


(2) LineEdit. cpp 是 我 们 很 熟悉 的 类 实现 文件 : 


@include *LineBdit.moc* 
include <qpuahbutton.h> 
finclude <qapplication.h> 
include «glabel.h» 
include «qlayout.h» 
include <iostrearm 


fi: 


LineEdit::LineEdit|QWidget *parent, const char *name) : QMainWindow(parent, name) 
{ 

QWidget *widget = new QWidget|this!; 

setCentralWidget (widget); 


(3) 用 QGridLayout 排 列 构件 。 指 定 行 数 、 列 数 、 边 距 和 间隔 : 


OGridLayout *grid = new QGridLayout (widget,3,2,10, 10, "grid"): 


QLineEMit *username_entry = new QLinezdit[| widget, "username entry*]; 
password entry = new QLineEdit( widget, ‘password entry"); 
password entry-»setEchoMode|QLineEdit::Password):; 


grid-»addWidgeti(naw QLabel(*Username", widget, *uüserlabel*), 0, 0, 0 
grid->addWidget (new QLabeli*Pansword', widget, "passwordlabel*], 1, 0, 0); 


grid-»addWidget (username entry, 0,1, 0); 
grid-»addWidget(password entry, 1,1, 0)) 


QPushButton *button = new QPushButton (*Ok", widget, "button"; 
grid-»addWidget(button, 2,1,0t::AÀ]1ignRight) ; 


resize( 350, 200 }; 


connect (button, SIGNAL(clicked(]], this, SLtOT(Clicked(]]); 
] 


| void LineEdit::Clicked(voidi) 
li 


std::cout << password entry-»text(] << *\n"; 
) 
int maintint argc, char **argv) 
( 

QApplication appiergc.argv]: 

LineEdit *window = new LineEdir|); 


app.aetMainWidget window]: 
window-»showl!; 


return app.execi): 


运行 这 个 程序 ， 你 将 看 到 如 图 17-5 所 示 的 窗口 。 
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实验 解析 

上 述 创 建 了 两 个 QLineEdit 构 件 ， 其 中 一 个 通过 设置 它 的 EchoMode 
将 其 变 为 密码 输入 框 ， 当 你 点 击 PushButton 按 钮 时 ， 它 的 内 容 将 被 输 
出 。 注 意 ， 程 序 中 引入 了 一 个 QGridLayout 构 件 ， 当 在 网 格 模式 下 布置 
构件 时 ， 它 非常 有 用 。 当 你 要 把 一 个 构件 添加 到 网 格 中 时 ， 需 要 传递 
行 号 和 列 号 。 左 上 角 的 单元 格 是 起 始 单元 格 ， 它 的 行列 号 分 别 是 0, 0 。 


17.4.» Qt 按钮 


按钮 构件 是 一 种 随处 可 见 的 构件 ， 不 同 的 工具 包 中 它 的 外 观 、 用 
法 和 API 都 变化 不 大 。Qt 当 然 也 提供 了 标准 的 PushButton 、CheckBox 和 
RadioButton 的 变 体 。 

1. QButton: 按钮 基 类 

Qt 中 的 按钮 构件 都 是 派生 自 抽 和 象 类 QButton。 这 个 类 有 查询 和 切换 
按钮 开关 状态 的 方法 ， 还 有 设置 按钮 文本 或 位 图 的 方法 。 

你 永远 不 需要 实例 化 一 个 QButton 构 件 自 身 〈 不 要 混 消 QButton 和 
QPushButton) ， 所 以 这 里 也 不 用 显示 它 的 构造 函数 ， 但 下 面 列 出 了 它 
的 几 个 有 用 的 成 员 函 数 : 


@include <qbutton.h> 


virtual void QButton:r:setText ( const QString & } 
virtual void QButton::setPixmap | const QPixmap & | 
bool QButton::isToggleButton () const 

virtual void QButton::setDown ( bool | 

bool QButton::isDown () const 

bool QButton::imOn () const 

enum QButton::ToggleState ( Off, NoChange, On ) 
ToggleState QButton::state () const 


TE TRUE NNNM 

TRUE ° 

通常 ， 当 某 个 选项 当前 不 可 用 时 ， 你 硕 望 能 禁用 它 或 让 它 显 示 为 

灰色 。 你 可 以 通过 调用 QWidget: : setEnable (FALSE) 来 禁用 包括 
QButton 在 内 的 任何 构件 。 

下 面 是 3 个 我 们 感 兴趣 的 QButton 子 类 。 
a 一 个 简单 的 按钮 构件 ， 它 在 被 点 击 时 执行 一 些 
A o 
O QCheckBox: 一 个 可 以 在 开 / 关 (on/off) 状态 之 间 切 换 ， 用 于 
表示 某 一 选项 的 按钮 构件 。 
口 QRadioButton: 通常 在 组 中 使 用 的 按钮 构件 ， 一 组 内 同时 只 能 

激活 一 个 按钮 。 

2. QPushButton 

QPushButton 是 一 个 标准 的 通用 按钮 ， 它 包含 如 OK 或 Cancel 这 样 的 
文本 或 一 个 像素 映射 图 标 。 与 所 有 的 QButton 一 样 ， 当 它 被 激活 时 会 发 
出 一 个 clicked 信 号 ， 这 个 信号 通常 会 连接 到 一 个 槽 并 执行 一 些 动作 。 

你 已 在 前 面 的 例子 中 用 过 QPushButton， 关 于 这 个 最 简单 的 Qt 构件 
还 有 一 件 值 得 说 的 事 : 你 可 以 调用 setToggleButton 将 QPushButton 从 一 
个 无 状态 按钮 转变 为 一 个 开关 按钮 〈 即 它 可 以 被 打开 或 关闭 ) 。 请 回 
忆 上 一 章 的 内 容 ，GTK+ 用 一 个 单独 的 构件 实现 此 功能 

从 完整 性 考虑 ， 这 里 提供 了 它 的 构造 钞 数 和 几 个 有 用 的 方法 : 


#include «qpushbutton.h» 


QPushButton (QWidget *parent, const char *name = 0) 
QPushButton (const QString &text, QWidget *parent, const char “name = 0) 
QPushButton (const QIconSet &icon, const QString &text, 

QWidget *parent, const char * name = 0 ) 


void QPushButton::setToggleButton (bool); 


3. QCheckBox 

QCheckBox 是 一 个 有 状态 的 按钮 ， 也 就 是 说 ， 它 可 以 被 打开 或 关 
闭 。 它 的 外 观 取决 于 当前 的 窗口 样式 (Motif > Windows®) ， 但 它 通 
党 是 一 个 右边 有 文本 的 打 勾 框 。 


你 还 可 以 将 QCheckBox 设 置 为 第 三 种 状态 ( 即 中 间 状 态 ， 以 表 
示 “ 无 改变 ”。 这 在 极 少数 情况 下 会 用 到 ， 比 如 说 你 无 法 读 取 QCheckBox 
代表 的 选项 的 状态 (因此 ， 你 自己 设置 QCheckBox 的 打开 或 关闭) ， 
但 是 仍然 想 给 用 户 一 个 机 会 保持 它 状态 的 不 变 。 


#include <qcheckbox.h> 


QCheckBox (QWidget *parent, const char *name = 0 ) 
QCheckBox (const QString &text, QWidget "parent, const char *name = 0 ) 


4. QRadioButton 

单 选 按钮 是 开关 按钮 ， 它 用 于 在 一 组 选项 中 只 能 选择 一 个 选项 的 
情况 (回想 那些 老式 汽车 的 收音 机 ， 每 次 只 有 一 个 电台 按钮 可 以 被 按 
F) 。QRadioButton 本 身 与 QCheckBox 几 乎 没有 什么 区 别 ， 这 是 因为 按 
钮 的 分 组 和 单 选 性 都 是 由 QButtonGroup 类 来 处 理 的 。 它 们 之 间 主 要 的 
区 别 是 ， 单 选 按 钮 的 外 观 是 圆 的 ， 而 不 是 一 个 打 勾 框 。 

QButtonGroup 是 一 个 构件 ， 它 提供 了 一 些 便捷 的 方法 ， 使 得 按钮 
组 的 处 理 更 加 容易 : 


QButtonGroup (QWidget ‘parent = 0, const char * name = 0 
QButtonGroup (const QGtring è title, QWidget * parent = 0, const char * name = 0 ) 


int insert (QButton *button, int id = -1) 


void remove (QButton *button 
int id (QButton *button) const 
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数 ， 它 甚至 还 提供 了 一 个 可 选 的 包围 按钮 的 框 染 。 

你 有 两 种 癌 QButtonGroup 添 加 一 个 按钮 的 方法 : 一 种 是 用 insert 方 
法 ， 男 一 种 是 将 QButtonGroup 指 定 为 按钮 的 父 构件 。 你 可 以 在 调用 
insert 时 指定 一 个 id 来 唯一 标识 组 中 的 每 个 按钮 。 这 在 查询 哪个 按钮 被 
选中 时 特别 有 用 ， 因 为 selectId 返 回 被 选中 按钮 的 id © 

所 有 加 到 组 内 的 QRadioButton 都 自动 具有 了 单 选 性 。 

下 面 是 QRadioButton 的 构造 画 数 和 唯一 的 方法 : 


finclude «qradiobutton.h» 


QRadioButton (QWidget *parent, const char *name = 0 ) 
QRadioButton (const QString &text, QWidget *parent, const char *name = 0 


bool QüRadioButton::isChecked () 


实 验 QButton 


让 我 们 通过 一 个 Qt 按钮 的 示例 程序 来 应 用 这 些 知 识 。 下 面 这 个 程 
序 通过 创建 不 同类 型 的 按钮 ( 单 选 按 钮 、 检 查 框 和 标准 按钮 ) 来 显示 
如 何在 应 用 程序 中 使 用 这 些 构件 。 
(1) 输入 Buttons.h: 


(2) fm. 你 将 在 本 HAHA 953 所 以 在 类 定义 中 将 
按钮 指针 声明 为 入 有， 还 有 一 个 辅助 函数 PrintActive 也 是 私有 的 : 
private: 
void PrintActive(QButton *button); 
OCheckBox *checkbox; 
QRadioButton *radiobuttonl, *radiobutton2; 


private slots: 
void Clicked(); 


(3) 下面 是 Buttons.cpp: 


#1 ID 

qapr 
a qlabe 
fi 1 y 
#i 

J n 1 nam OMain pare ime 
iE x y get x 
sheckbox new QCheckBox[*CheckButton*, widget, *check"); 


a 你 为 两 个 单 先 先 按钮 创建 了 一 个 QButtonGroup: 


(5) 接 下 来 是 一 个 输出 给 定 QButton 状 态 的 便捷 方法 : 


实验 解析 

这 个 简单 的 例子 显示 了 如 何 查询 各 种 类 型 的 Qt 按钮 。 正 如 你 所 看 
到 的 ， 这 些 构件 在 创建 后 大 多 数 情 况 下 的 工作 方式 基本 相同 。 例 如 ， 
PrintActive 函 数 显示 了 如 何 获取 一 个 按钮 的 状态 《打开 或 关闭 ) 。 请 注 
意 ， 这 个 函数 可 以 用 于 所 有 维持 状态 的 按钮 类 型 ， 如 检查 框 和 单 选 按 
钮 。 在 大 多 数 情况 下 ， 只 有 创建 这 些 按钮 构件 的 方法 彼此 不 同 。 相 对 
而 言 ， 单 选 按 钮 的 创建 过 程 是 最 复杂 的 (因为 一 个 组 中 同时 只 能 有 一 
个 按钮 处 于 打开 状态 ) ， 它 需要 的 工作 量 最 大 。 对 单 选 按 钮 来 说 ， 你 
需要 先 创建 一 个 QButtonGroup， 以 确保 组 中 在 任何 时 候 只 能 有 一 个 单 
选 按钮 是 激活 的 。 


17.4.5 QComboBox 


单 选 按钮 适用 于 用 户 从 少量 选项 〈6 个 或 更 少 ) 中 进行 选择 的 情 
况 。 当 多 于 6 个 选项 时 ， 你 束 很 难 控制 窗口 的 大 小 在 一 个 合理 的 范围 
内 ， 而 且 随 着 选项 数目 的 增多 ， 这 一 状况 会 越 来 越 严 重 。 一 个 完美 的 
解决 方案 是 使 用 一 个 融 有 下 拉 沫 单 的 输入 框 ， 即 组 合 框 。 当 你 点 击 荣 
现 ， 选 项 的 数目 只 受到 搜索 选项 列表 方便 程度 的 限 

J| o 
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它 使 用 户 可 以 从 一 个 无 限 的 选项 中 选择 一 个 选项 。 

QComboBox 可 以 是 读 / 写 或 只 读 的 。 在 读 / 写 模式 下 ， 用 户 可 以 输 
而 在 只 读 模式 下 ， 用 户 只 能 从 下 拉 荣 单 中 进行 选 
X o 

在 创建 QComboBox 时 ， 你 可 以 通过 其 构造 函数 的 一 个 布尔 值 参 数 
来 指定 它 是 读 / 写 模 式 ， 还 是 只 读 模式 : 

QComboBox *combo = new QComboBox (TRUE, parent, “widgetname”) ; 

传递 TRUE 将 QComboBox 设 置 为 读 / 写 模式 。 其 他 参数 是 常 
构件 指针 和 构件 名。 

与 所 有 Qt 构件 一 样 ，QComboBox 的 使 用 方式 很 灵活 ， 而 且 
了 大 量 的 功能 。 你 可 以 单个 添加 选项 ， 也 可 以 一 次 添加 一 组 
QString 或 传统 的 char* 格 式 ) 。 

你 可 以 调用 insertItem 来 插入 一 个 选项 : 

combo->insertItem(QString ("An Item"), 1); 

它 有 一 个 QString 对 象 参 数 和 一 个 位 置 索引 参数 。 值 1 设置 该 选项 为 
列表 中 的 第 一 个 选项 。 如 有 果 你 想 将 它 添加 到 列表 的 末尾 ， 只 需 传递 一 
个 任意 的 负 整 数 即 可 。 

更 常见 的 情况 是 一 次 添加 多 个 选项 ， 这 时 你 可 以 使 用 QStrList 类 ， 
或 者 像 下 面 这 样 用 一 个 char* 数 组 : 


同样 ， 你 也 可 以 指定 插入 项 在 列表 中 的 索引 。 

如 采 QComboBox 是 读 / 写 模式 ， 那 么 用 户 输入 的 值 将 目 动 加 入 到 选 
项 列表 中 。 这 是 一 个 很 有 用 的 节省 时 间 的 功能 ， 当 用 户 想 不 止 一 次 地 
选择 同一 个 输入 值 时 ， 它 可 以 市 省 用 户 重 复 输入 的 时 间 。 

InsertionPolicy 控 制 新 输入 的 值 在 选项 列表 的 何 处 插入 。 你 可 以 选 
择 的 选项 见 表 17-4。 


表 17-4 
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你 可 以 调用 setInsertionPolicy 方 法 来 设置 QComboBox 的 插入 寅 上 略 : 
combo->setInsertionPolicy (QComboBox: :AtTop) ; 
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#include <qcombobox.h> 
QComboBox (QWidget “parent = 0, const char *name = 0) 


QComboBox (bool readwrite, QWidget *parent = 0, const char *name = 0) 


int count () 

void insertStringList (const QStringList &list, int index * -1) 

void insertStrList (const QStrList list, int index * -1) 

void insertStrList (const QStrList *list, int index = -1) 

void insertStrList (const char **atrings, int numStrings = -1, int index = -1) 
void insertItem (const QString &t, int index = -1) 

void removeltem (int index) 


virtual void setCurrentItem [int index) 

QString currentText () 

virtual void setCurrentText [const QString è) 
i mab I dmm dt d 


count EX 23 3 [9] 71] Fe FR GB) ZH.» QStringListfliQStrListzé VK A DÀ 
用 来 增加 选项 的 Qt 字符 串 集 合 类 。 你 可 以 调用 removeItem 来 删除 选项 ， 
调 用 currentText 和 setCurrentText 来 获取 和 设置 当前 选项 ， 调 用 
setEditable 来 切换 可 编辑 状态 。 

当 一 个 新 选项 被 选中 时 ，QComboBox 就 发 出 textChanged 

(QString&) 信号 ， 并 以 新 选中 的 选项 做 为 其 参数 。 

实 验 QComboBox 

在 本 例 中 ， 你 将 党 试 使 用 QComboBox， 并 看 到 这 参数 的 信号 和 楼 
是 如 何 工 作 的 。 你 将 创建 一 个 继承 自 QMainWindow 的 ComboBox 类 。 它 
有 两 个 QComboBox ， 一 个 是 读 / 写 模式 ， 一 个 是 只 读 模 式 ， 你 将 连接 
textChanged 信 号 ， 以 获取 每 次 选中 的 值 。 

(1) 输入 下 列 代码 ， 并 将 它 命名 为 ComboBox.h: 


@include <qmainwindow, h> 
include <qcombobox.h> 


class ComboBox : public QMainWindow 
( 
Q OBJECT 


public: 
ComboBox(QWidget *parent = 0, const char *name * 0); 


private glots: 
void Changed(const QStríngá aj; 


(2) 界面 由 两 个 QComboBox 构 件 组 成 ， 一 个 可 编辑 ， 男 一 个 是 只 
读 模式 。 你 在 两 个 构件 中 放置 相同 的 选项 列表 : 


#include <glayout.h> 
#inclode <iostream> 


ComboBox: :ComboBox(QWidget "parent, const char *name) : QMainWindow!parent, nase) 
t 
QWidget *widget = new (QNidget(thía); 


setCentralWidget (widget); 
QVBoxLayout *vbox = new QVBoxLseyout (widget, 5, 10. *vbox*); 


QComboBox *editablecambo = new QComboBox(TRUE, widget, "edítable"!; 
vbox-»addWidget | editablecombo!: 

QComboBox *readoniycombo = new QComboBox(FALSE, widget, 'readonly*); 
vbox-»addWidget |readonlycombo!: 


static const char* items[] = ( *Macbeth*, “Twelfth Night", "Othello", 0 }; 
editableccmbo-»insertStrList (items); 
readoniycombo-»insertStrList (items); 


connect [editablecombo, SIGNAL{textChanged(const QString&)), 
this, SLOT(Changed(const QStringk])): 
resize| 350, 200 }; 


) 


(3) Pie Renae o HERR BRE S PBN QString AL: 
void ComboBox::Changediconst QStrings s) 

| StG: C0Ut << s << "in"; 

) 


int main(int argc, char **argv) 

{ 
QApplication applargc, argv); 
ComboBox *window = new ComboBox {) ; 


app . set NeinWidget (window) ; 
window->show({)7 


return app.exec(); 


在 图 17-6 中 ， 你 可 以 看 到 ， 可 编辑 的 QComboBox 里 新 选中 的 选项 
输出 在 命令 行 上 。 
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lericfj@kayok chap17 src]$ ./combobox 
Twelfth Hight 


combobox 


创建 组 合 框 构件 的 过 程 与 创建 任何 其 他 构件 的 过 程 非常 相似 。 它 
主要 增加 了 一 个 对 insertStrList 函 数 的 调用 来 存储 组 合 框 的 选项 列表 。 

和 其 他 包含 文本 的 构件 一 样 ， 你 可 以 设置 一 个 芳 数 ， 每 当 组 合 框 
中 的 值 (或 更 通用 的 说 法 ， 文 本) 被 改变 时 ， 该 函数 就 会 被 调用 。 


17.4.4 OListView 


Qt 中 的 列表 和 树 由 QListView 构 件 提供 。QListView 既 可 以 显示 平面 
列表 ， 也 可 以 显示 被 分 为 行 和 列 的 层次 化 数据 。 它 非常 适合 于 显示 如 
目录 结构 这 样 的 数据 ， 因 为 子 元 素 可 以 通过 点 击 加 减 (+/-) 框 被 展开 
和 收 起 ， 就 像 一 个 文件 查看 器 一 样 。 

与 GTK+ 的 ListView 构 件 不 同 ，QListView 同 时 处 理 数据 和 视图 ， 虽 
然 它 没有 提供 很 好 的 灵活 性 ， 但 却 提供 了 很 好 的 易 用 性 。 

在 使 用 QListView 时 ， 你 可 以 选择 行 或 单独 的 单元 ， 然 后 剪 切 和 烙 
贴 数据 、 按 列 排序 ， 而 且 你 可 以 在 单元 里 放置 QCheckBox 构 件 。 
ee 了 很 多 功能 ， 程 序 员 只 需 添 加 数据 和 建立 一 些 格式 规 
My e 

你 按 通 常 的 方式 创建 QListView， 指 定 父 构件 和 构件 名 : 


d 可 n adácolumr 上 来 设置 标题 : 


view-»addColuszn!*Left 
»addcolusm|"Ri th aut 


列 宽 按 像素 设置 ， 如 果 省 略 此 参数 那么 默认 它 为 该 列 中 最 宽 的 
元 素 的 宽度 。 当 列 中 元 素 增 加 或 减少 时 ， 列 会 自动 调整 其 宽度 。 

数据 通过 QListViewItem 对 象 添加 到 QListView， 它 代表 了 一 行 数 
据 。 你 所 要 做 的 就 是 把 QListView 和 和 行 元 素 传 递 给 QListViewItem 的 构造 
d AE ee 

i (本 例 即 是 如 此 ) ， 要 么 是 另 一 
个 QListViewItem。 如 果 你 传递 了 一 个 QListViewItem ， 这 一 行 会 变 成 该 
QListViewItem 的 子 广 点 。 树 形 结构 就 是 通过 传递 一 个 QListView 作 为 顶 
Ey cs DUAE 这 传递 的 QListViewItem 作 为 子 节 点 而 形成 的。 

其 余 参 数 是 每 列 的 数据 ， 如 果 没 有 设置 束 默 认为 NULL ° 

RE 添加 一 个 子 节 点 只 需要 传递 一 个 顶层 指针 。 如 果 不 想 在 将 
"s SE E— 个 QListViewItem 下 添加 子 节 点 ， 你 就 不 需要 保存 返回 的 指 


如 果 看 一 AD 你 会 会 ,看 到 用 PÈ 历 树 的 各 种 方 
E (如 果 你 想 要 修改 特定 行 的 话 ) : 


#include <qlistview.h> 


virtual void insertItem (| QListViewItem * newChild ) 
virtual void setText ( int column, const QString & text ) 


virtual QString text ( int column ) const 
QListViewItem *firstChild () const 
QListViewItem *nextSibling () const 
QLiístViewItem *parent () const 
QListViowltem *itemAbove () 
QListViewItem *itemBelow () 


你 可 以 通过 在 QListView 目 身上 调用 firstChild 来 获取 树 中 的 第 一 
行 。 然 后 ， 通 过 反复 调用 firstChild 和 nextSibling 来 返回 这 个 树 的 一 部 分 
或 全 部 。 

下 面 这 段 代 码 输出 所 有 顶层 节点 的 第 一 列 : 


witem *child = view->firstChild() 


你 可 以 在 Qt API 文 档 中 找到 关于 QListView ^ QListViewltem 和 
QCheckListViewH ATA ZH ° 


x 验 QListView 

在 这 个 实验 中 ， 运 用 你 所 学 的 知识 ， 编 写 一 个 短小 的 QListView 构 
件 示例 程序 。 

K WEM, ERNEA, ERA R AE M 
ListView.cpp: 


tinclude "ListView, moo" 


ListView: GistView|(Widget "parent, const char ‘name) : QHainiindow(parent, nama) 
| 
latviai = new QiatViewlthis, "listviewl); 


Matview-oaddcolum ("Artist"); 
Hatviev-naddColum ("Title"); 
Ligtvlew->addColum | "Catalogue" ]; 


Latvieu-»set Root IaDecorated (TRUE); 


(ListWievtten "toplevel = new QuistViewtten(liatviaw, "Avril Lavigne 
"Lat Go’, Ayeni’) i 


new QListViewltem|toplevel, "Complicated! ; 
new QlistViewlten(toplevel, ‘Skier Bol"); 


getCentralilidget (Listview) ; 
| 


int main|int arge, char *"argy) 

| 
QApplication applarge, argu] ; 
ListView "window = naw ListView); 


app. setiainili dget (window) | 
window->show|| ; 


return app.exec(); 


实验 解析 

QListView 构 件 看 上 去 很 复杂 ， 因 为 它 同时 扮演 了 项 目 列表 和 项 目 
树 的 角色 。 你 的 代码 需要 为 列表 中 的 每 个 元 素 创建 一 个 QListViewItem 
实例 。 每 个 QListViewItem 实 例 都 有 一 个 父 太 点 。 使 用 构件 本 和 号 作为 其 
QT AN ee TA, EH 另 一 个 QListViewItem 作 为 其 父 节 APET 
5. 点 > MAE Gm 个 只 有 一 层 深 度 的 QListViewItem 实 例 ， 但 你 
实际 上 可 以 创建 更 深 的 节 点 树 。 
apn Coe eve 子 ， 你 将 看 到 如 图 17-7 所 示 的 QListView 

TER: 子 行 是 如 何 相 对 于 父 行 缩 进 的 。 Mn UN. 
可 折 营 的 行 ， 它 们 在 默认 情况 下 不 展现 出 来 。 你 是 通过 setRootIs- 
Decorated 来 设置 它们 的 。 


Tistview 


|ritie [Catalogue | 
AvrilLavigne [Let Go AVCDOl | 
EE - complicated 


i- SkBer Boi 


17.5 ”对话 框 


到 现在 为 止 ， 你 都 是 通过 继承 QMainWindow 来 创建 界面 。 对 应 用 
程序 中 的 主 窗口 来 说 ， 使 用 QMainWindow 是 合适 的 ， 但 对 于 生命 期 比 
较 短 的 对 话 框 来 说 ， 你 应 该 使 用 QDialog 构 件 。 

当 你 想 让 用 户 为 某 一 特定 任务 输入 特定 的 信息 时 ， 或 者 你 想 癌 用 
户 显 示 一 些 信息 (如 一 条 Ce er BAe RH) 时 ， 对 话 框 是 很 有 用 的 。 
通过 继承 QDialog 来 完成 这 些 任务 是 一 个 好 方法 ， 因 为 你 可 以 获取 到 一 
ee ERAR TTE fi Fe AER FH P? nig 
N/ o 

除了 通常 的 模式 对 话 框 和 非 模式 对 话 框 以 外 ，Qt 还 提供 了 一 种 半 
模式 对 话 框 。 下 面 我 们 来 回顾 一 下 模式 对 话 框 和 非 模 式 对 话 框 的 区 
别 ， 同 时 也 看 看 何 为 半 模 式 对 话 框 。 

O 模式 对 话 框 : 阻止 所 有 其 他 窗口 的 输入 ， 以 强制 用 户 响应 当 

它 用 于 从 用 户 那 里 获取 即时 的 啊 应 和 显示 严重 的 错误 


口 “ 非 模式 对 话 框 : 非 阻塞 窗口 ， 与 应 用 程序 中 的 其 他 窗口 一 起 
正常 操作 。 它 用 于 搜索 或 输入 窗口 ， 你 可 以 在 它 和 主 窗口 之 间 复 
制 、 粘 贴 数 据 。 

O 半 模 式 对 话 框 :一 个 没有 自己 的 事件 循环 的 模式 对 话 框 。 这 
样 可 以 将 控制 权 返 回 到 应 用 程序 ， 但 仍 阻 窗 对 话 框 以 外 的 所 有 窗 
口 输 入 。 它 只 在 极 少数 情况 下 有 用 ， 比 如 当 你 有 一 个 进度 条 表示 
某 个 耗 时 的 关键 操作 的 进度 时 ， 你 可 能 想 要 给 用 户 一 个 取消 的 机 
会 。 因 为 半 模 式 对 话 框 没 有 上 自己 的 事件 循环 ， 所 以 你 必须 定期 调 
用 QApplication: : processEvents 来 更 新 对 话 框 。 


17.5.1 QDialog 


QDialog 是 Qt 中 的 对 话 框 基 类 ， 它 提供 了 exec 和 show 方 法 来 处 理 模 
moll tus ， 集 成 了 QLayout， 并 有 几 个 用 于 响应 按钮 按 下 的 
HS Ae o 

你 通常 将 为 对 话 框 创建 一 个 继承 目 QDialog 的 类 ， 回 其 中 增加 构件 
来 创建 对 话 框 界面 : 


与 QMainWindow 不 同 ， 你 可 以 直接 将 QLayout 对 象 的 parent 参 数 设 
， 而 无 需 创 建 一 个 无 用 的 QWidget， 并 将 它 作 为 QLayout 
AP REE o 


注意 ， 这 个 例子 省 略 了 用 于 创建 ok pushbutton 和 
cancel_pushbutton 构 件 的 代码 。 


QDialog 有 两 个 权 : (accept 和 和 reject) ， 它 们 用 于 表明 对 话 框 的 结 
果 。 这 个 结果 由 exec 方 法 返回 。 通 常情 况 下 ， 你 将 OK 和 Cancel 按 钮 的 
信号 连接 到 柳 ， 束 像 在 上 面 的 MyDialog 类 中 所 做 的 那样 。 

1. 模式 对 话 框 

要 将 对 话 框 作为 模式 对 话 框 ， 你 需要 调用 exec。 该 贸 数 弹出 对 话 
框 ， 并 根据 被 激活 的 槽 返回 QDialog: : Accepted 或 QDialog: : 
Rejected: 


"dia 
y 


对话 框 在 exec 返 回 时 会 自动 隐藏 ， 但 你 仍然 要 从 内 存 中 删除 它 。 
注意 ， 在 调用 exec 时 ”其 他 所 有 处 理 都 被 阻塞 ”所 以 当 程序 中 有 
对 时 间 要 求 比较 高 的 代码 时 ， 使 用 非 模式 或 半 模 式 对 话 框 更 加 合适 一 


2. 非 模式 对 话 框 | 

非 模 式 对 话 框 与 普通 主 窗口 没有 多 大 区 别 ， 主 要 的 不 同 是 非 模式 
对 话 框 将 它们 目 己 定位 在 其 父 窗口 之 上 ， 与 父 和 窗口 共享 任务 栏 ， 并 在 
accept 或 reject 模 被 调用 时 目 动 隐藏 。 


要 显示 一 个 非 模 式 对 话 框 ， 与 显示 QMainWindow 的 方式 相同 ， 调 
ee 


show EN i GL TOMA, 随后 立即 返回 继续 处 理 循环 。 为 了 处 理 按 
钮 按 下 事件 ， 你 需要 编写 槽 函数 并 连接 醒 : 


Do some ther processing 


LEES RHEE, “MRE RENI, HEC ELSE o 

3. 半 模 式 对 话 框 

要 创建 半 模 式 对话 框 ， 你 必须 在 QDialog 的 构造 画 数 中 设置 模式 标 
志 ， 并 使 用 show 方 法 : 

QDialog ( QWidget *parent=0 , const char *name=0 , bool 
modal-FALSE, WFlags f=0) 

对 于 模式 对 话 框 ， 你 没有 将 modal 设 置 为 TRUE 的 原因 是 : 调用 
exec 将 强制 对 话 框 变 为 模式 对 话 框 ， 而 不 管 这 个 标志 是 什么 。 
si LNT EO 下 所 示 : 


MySMDialog 


— AE SEPT iE, UREA LA yal show WBN, ZARARASAÍTI 
程序 ， 并 定期 调 AUI nee _ ProcessEvents BT 对 话 框 : 


MySMDialog *disiog 


pr SE MEE Z HI, BRIN VETE AR BCR o JERR, wasCancelled 
并 不 是 QDialog 的 一 部 分 ， 你 必须 目 己 提 供 它 。 


Qt 还 提供 了 现成 的 QDialog 子 类 ， 它 们 专用 于 特定 的 任务 ， 如 文件 


WS ° 


选择 、 文 本 输入 、 进 度 条 和 请 轧 框 等 。 使 用 这 些 构件 可 以 省 去 你 许多 


17.5.2 QMessageBox 


QMessageBox 是 一 个 模式 对 话 框 ， 它 用 于 显示 一 段 简单 的 消息 ， 
并 伴 有 图 标 和 按钮 。 图 标的 样式 取决 于 消息 的 严重 程度 ， 它 可 以 是 党 
规 信 息 、 和 警告 或 其 他 的 关键 信息 。 

下 面 是 QMessageBox 类 用 于 创建 和 显示 这 3 类 信息 的 静态 方法 : 


#include <qmessagebox.h> 


int information (QWidget *parent, 
int button0, int 
int warning (QWidget "parent, 
int button0, int 
int critical (QWidget "parent, 
int buttonO, int 


const QString &caption, const QString &text, 
buttonl=0, int button2=0) 

const QString &caption, const QString &text, 
buttonl, int button2«0) 

const QString &caption, const QString &text, 
buttonl, int button2=0) 


QMessageBox 预 先 提供 了 一 系列 的 按钮 ， 它 们 与 上 述 静 态 方 法 的 


返回 值 相对 应 : 

O QMessageBox: : Ok; 

O QMessageBox: : Cancel; 

O0 QMessageBox: : Yes; 

[] QMessageBox: : No; 

O0 QMessageBox: : Abort; 

O QMessageBox: : Retry; 

[] QMessageBox: Ignore ° 
QMessageBoxfY 一 个 典型 使 用 方法 如 下 所 示 : 


你 将 按钮 代码 与 Default 和 Escape 做 或 (| D) 运算 ， 是 为 了 设置 键 
盘 上 的 Enter 键 和 Esc 键 被 按 下 时 的 移 认 动作 。 节 终 的 对 话 框 如 图 17-8 所 


示 o 


Engine Room Query 


A) Do you wish to engage the HyperDrive? 


17.5.3 QInputDialog 


QimputDialog 用 于 输入 单 值 数据 ， 它 可 以 是 文本 、 一 个 下 拉 列 表 
中 的 选项 、 一 个 整数 或 一 个 浮 点 数 。QInputDialog 类 有 与 QMessageBox 
类 似 的 静态 方法 ， 不 过 更 复杂 一 点 ， 因 为 它们 有 许多 参数 ， 但 好 在 大 
多 数 参 数 都 有 默认 值 。 


#include «ginputdialog.h» 
QString getText (const QString &caption, const QString &label, 


QLineEdit::EchoMode modesQLineEdit::Normal, 
const QString &text»QString::null, bool * ok = 0, 
QWidget * parent = 0, const char * name = 0) 


QString getitem [const QString &caption, const QString &label, 
const QStringList &list, int current*0, bool editable»*TRUE, 
bool * ok*«0, QWidget *parent = 0, const char *name«0) 


int getInteger (const QString &caption, const QString &label, int num», 
int from = -2147483647, int to = 2147483647, int step = 1, 
bool * ok = 0, QWidget * parent = 0, const char * name * 0) 


double getDouble [const QString &caption, conat QString &label, double mum = 0, 
double from = -2147483647, double to = 2147483647, 
int decimals = 1, bool * ok = 0, QWidget * parent = D, 
const char * name = 0 ) 


ADR EUN ITAR, den] DE a 5 IUS: 


bool result; 

QString text = QInputDialog::getText|('Question", "What is your Quest?:* 
QLineEdit::Norsal, 
OString:inull, &result,. this. *'input* ]! 

if (result) ( 

doSomathing (text); 

) else { 

// umer pressed cancel 

) 


QinputDialog 由 一 个 QLineEdit 构 件 和 OK、Cancel 按 钮 组 成 ， 见 图 
17-9 ° 


Question 


What is your Quest?: 


to find the grail. 


HH QInputDialog: :getText 创 建 的 对 话 框 使 用 了 一 个 QLineEdit 构 件 。 
你 传递 给 getText 函 数 的 编辑 模式 参数 用 于 控制 如 何 将 文本 回 显 给 用 
户 ， 这 与 QLineEdit 构 件 中 同一 模式 的 作用 完全 相同 。 你 还 可 以 设置 默 
认 的 文本 或 像 上 面 那样 将 它 设置 为 空 。 每 个 QInputDialog 都 有 OK 和 
Cancel 按 钮 ， 它 传递 一 个 布尔 值 指针 给 该 方法 以 表明 哪个 按钮 被 按 
下 。 如 采用 户 按 下 OK 按钮 ， 那 么 result 将 为 TRUE 。 

getItem 通 过 QComboBox 回 用 户 提 供 一 个 选项 列表 : 


QStringList options; 
options << *'London" << "New York* << "París"; 
Dialog: :getz 


QString city = QInputDialog::getztem(*Holiday", ‘Please select a destination:* 
prions, 1, TRUE, &result, this, "combo*]; 
if (result) 
`, N 
生成 的 对 话 框 见 图 17-10 ° 


Holiday 
Please select a destination: 


Paris] «| 
EL ILLU 


图 17-10 


" getInteger 和 getDouble 的 工作 方式 都 类 似 ， 我 们 在 这 里 就 不 展开 讲 


17.5.4 ”使 用 qmake 简 化 makefile 文 件 的 编写 


Zu FE f HI KDE PERI QUAE A Be SES, DL PK A makefile 
文件 变 得 非常 复杂 ， 它 需要 使 用 moc， 并 且 到 处 都 要 用 到 库 。 泣 运 的 
m Qt 目 市 了 一 个 被 称 为 qmake 的 工具 ， 它 可 以 帮助 你 创建 makefile 文 


如 采 以 前 使 用 过 Qt， 你 可 能 会 对 工具 tmake 比 较 熟 悉 ， 它 十 
人 ` 类似 qmake 的 工具 (现在 已 不 


dmake 以 .pro 文 件 作 为 输入 。 这 个 文件 包含 了 编译 所 需 的 最 基本 信 
息 ， 如 源 文件 、 头 文件 、 目 标 二 进 制 文件 和 KDE/Qt 库 的 位 置 。 
一 个 典型 的 KDE.pro 文 件 如 下 所 示 : 


ey rn 


你 指定 了 目标 二 进 制 文件 、 临 时 的 moc 和 目标 目录 、KDE 库 路 
径 、 要 编译 的 源 文件 和 头 文件 。 注 意 ，KDE 头 文件 和 库 文 件 的 目录 取 
决 于 你 所 使 用 的 Linux 发 行 版 。SUSE 用 户 要 把 INCLUDEPATH 设 置 为 
/opt/kde3/include, QMAKE LIBDIR X11ix &7j/opt/kde3/lib ° 

$ qmake file.pro -o Makefile 

接 下 来 ， 你 就 可 以 像 通 常 一 样 运行 make， 束 这 么 简单 。 对 于 任何 
复杂 程度 的 KDE/Qt 程 序 来 说 ， 你 都 应 该 使 用 qmake 来 简化 编译 过 程 。 


17.6 KDE TAI 


为 了 展示 KDE 构 件 的 强大 功能 ， 我 们 把 菜单 和 工具 栏 留 到 最 后 来 
讲 ， 因 为 它们 非常 好 地 说 明了 ， 相 比 使 用 Qt 或 其 他 图 形 用 户 界 面 工具 
包 ，KDE 库 是 如 何 节省 时 间 和 精力 的 。 

通常 在 GUI 库 中 ， 菜 单项 和 工具 栏 项 是 不 同 的 元 素 ， 它 们 各 有 各 
你 必须 分 别针 对 它们 创建 对 象 并 跟踪 其 变化 ， 例 如 单独 禁用 

一 工 

KDE 程 序 员 提出 了 一 个 更 好 的 解决 方案 。 与 使 用 分 开 解决 的 方法 
不 同 ，KDE 定 义 了 一 个 KAction 构 件 来 代表 应 用 程序 可 以 执行 的 动作 。 
这 个 动作 可 以 是 打开 新 文档 、 保 存 文件 或 显示 帮助 窗口 等 。 

创建 KAction 时 ， 向 它 传递 一 个 文本 、 人 快捷 键 、 图 标 和 酸 
(KAction 被 激活 时 调用 ) : 


本 
这 样 你 就 创建 了 一 个 New 菜 单 和 工具 栏 项 。 在 它 被 点 击 时 ， 将 调 
用 newFile ° 
如 果 你 想 禁 用 KAction， 比 如 说 你 不 想 让 用 户 创建 新 文件 ， 只 需 下 
面 一 行 代码 : 
new _file->setEnabled(FALSB) ; 
这 驶 是 KDE 沫 单 和 工具 栏 的 所 有 内 容 ， 的 确 很 答 单 。 下 面 看 一 下 
KAction 的 构造 男 数 ; 


finclude <kde/kaction.h> 


KAction (const QStrin ng åte st KShortcut &c nst QObject *receiver, 
const char *slot, pé *parent, st die *name = 0) 


KDE 提 供 了 标准 的 KAction 对 象 ， 这 确保 了 文本 、 图标 和 快捷 刍 在 
所 有 KDE 应 用 程序 中 都 是 一 样 的 : 


Rinclude <kde/kaction.h> 


KAction * openNew (const QObject *recvr, const char ‘slot, 
KActionCollection* parent, 
const char *name = 0 ) 

KAction * save ... 

KAction * saveAs ... 

KAction * revert ... 

KAction * close ... 

KAction * print ... 

etc... 


每 个 标准 动作 都 使 用 相同 的 参数 : ee eA eB, — n 
KActionCollection 对 象 和 和 KAction 名 字 。KActionCollection 对 象 管 理 窗 
口中 的 KAction， 你 可 以 通过 调用 KMainWindow 的 action-Collection 方 
法 来 得 到 当前 对 象 : 


x 验 一 个 带 有 菜单 和 工具 栏 的 KDE 应 用 程序 
你 将 在 下 面 这 个 例子 中 党 试 在 KDE 应 用 程序 中 使 用 KAction 。 
(1) 首先 ， 从 头 文件 KDEMenuh 开始 。 KDEMenu 是 
KMainWindow 的 子 类 ，KMainWindow 本 身 又 是 QMainWindow B] F 
类 。KMainWindow 在 KDE 中 处 理会 话 管理 ， 它 集成 了 工具 栏 和 状态 


M. 


— 0 


kmainwindow.h 


ibcutApt 


(2) 在 KDEMenu.cpp 中 ， 第 一 行 的 #include 语 句 用 于 包括 你 将 使 
用 的 构件 声明 : 


(3) 在 构造 函数 中 ， 你 创建 了 3 个 KAction 构 件 。new_file 以 手工 
定义 的 方式 创建 ，quit_action 和 help_action 使 用 标准 的 KAction 定 义 : 


! CAL 


(4) 创建 两 个 顶层 菜单 ， 并 把 它们 插入 到 KApplication 菜 单 栏 


(5) 现在 ， 在 菜单 和 工具 栏 中 揪 入 动作 ， 并 在 new_file 和 
quit_action 之 间 插 入 一 个 分 隅 线 : 


(6) 最 后 是 一 些 槽 定义 : aboutApp 创 建 一 个 KAbout 对 话 框 来 显 
示 程 序 相 关 信 息 。 注 意 ，quit 模 是 作为 KApplication 的 一 部 分 来 定义 
的 : 


(7) 接 下 来 ， 你 需要 为 qmake 创 建 一 个 menu.pro 文 件 : 


- r/ir la 
Xii + KDEDI 
Svan) tor 
f Fy 
E Ment .bh 
8) | eit Hi 
gmake menu.pro -o Makefil 
ke 
/kdene 
实验 解析 
y 


EX SIF REAM IF RE, (AE ONS EASY 
代码 还 是 相对 比较 简洁 的 。KAction 构 件 的 好 处 是 : 你 可 以 在 多 个 地 方 
使 用 它 ， 如 在 工具 栏 中 和 在 荣 单 栏 上 的 荣 单 中 ， 这 些 都 在 这 个 例子 中 
有 所 表现 o 

编译 KDE 应 用 程序 所 需 的 工作 量 比 编译 其 他 大 多 数 程 序 都 要 多 ， 
至 少年 一 看 是 这 样 。 但 事实 上 ，menu.pro 文 件 和 qmake 命 令 已 隐藏 了 大 
量 的 设置 ， 否 则 你 必须 在 makefile 文 件 中 手工 进行 这 些 设置 。 

图 17-11 和 图 17-12 显 示 了 窗口 中 菜单 和 工具 栏 按钮 的 外 观 。 


\ = — EDGE - E P3 
File Help 


| 


图 17-11 


@ = kdemenu 
‘Eile Help 
B New CtritN 
[9] Quit Ctri+Q 


图 17-12 


至 此 ， 我 们 已 经 学 习 完 了 Qt 和 KDE， 并 日 介绍 GUI 应 用 程序 的 
基本 元 素 ， 包 括 窗 口 、 布 局 、 按 钮 、 对 话 框 和 菜单 。 但 还 有 许多 Qt 和 
KDE 构 件 示 介绍， 如 QColorDialog (颜色 选取 对 话 框 ) ^ KHTML 
ees 等 ， 它 们 在 Trolltech 和 KDE 的 网 站 上 都 有 详细 的 

IVER ° 


17.7_ 使 用 KDE/Qt 编 写 CD 数 据 库 应 用 程 
序 


让 我 们 再 次 把 注意 力 集中 到 CD 应 用 程序 上 来 ， 现 在 你 可 以 用 
KDE/Qt 的 强大 功能 来 实现 它 了 。 你 将 使 用 和 第 16 章 一 样 的 窗口 布 
局 ， 并 实现 类 似 的 功能 。 

先 回忆 一 下 你 想 让 CD 数据 库 应 用 程序 实现 的 功能 : 
通过 GUI 界 面 登录 数据 库 ; 
搜索 CD; 
显示 CD 和 曲目 信息 ; 

向 数据 库 中 添加 CD; 
显示 一 个 “关于 ” (About) 窗口 。 


17.71 ŁO 


, "o a 口 开始 ， 它 包含 搜索 输入 构件 和 搜索 
ZE | 9 

— (1) 先 输入 MainWindow.h 的 代码 〈 或 从 本 书 的 网 站 上 下 载 
€E) 。 因 为 窗口 包含 一 个 用 于 搜索 CD 的 QLineEdit 构 件 和 一 个 用 于 显 
不 搜索 结果 的 QListView 构 件 ， 所 以 你 需要 包含 qlistviewh 和 qlineedit.h 


L] L1 F1 L1 LI 


(2) MainWindow.cpp 是 这 个 程序 中 最 复杂 的 部 分 。 在 构造 函数 
中 ， 你 创建 主 窗口 界面 并 将 必需 的 信号 连接 到 柳 。 与 以 往 一 样 ， 从 
#includei# AJ FF ue: 


(3) 现在 用 KAction 构 件 创建 菜单 和 工具 栏 项 : 


(4) 为 了 寻求 变化 ， 你 用 QBox 布 局 构件 来 取代 通常 的 QLayout 


(5) 接 下 来 是 QListView 构 件 ， 它 占 据 了 窗口 的 大 部 分 区 域 。 然 
后 ， 你 将 必需 的 信号 连接 到 doSearch 柳 ， 来 执行 CD 数据 库 查 询 。 你 添 
加 一 条 空 信息 让 KMainWindow 的 状态 栏 可 见 : 


(6) doSearch 模 是 应 用 程序 中 最 重要 的 部 分 。 它 读 取 搜索 字符 
串 ， 提 取 所 有 匹配 的 CD 和 它们 的 曲 日 。 其 逻辑 和 第 16 间 中 
GNOME/GTK+ 的 doSearch 完 全 相同 。 


(7) 提取 匹配 CD 的 标识 (d) ， 更 新 状态 栏 以 显示 搜索 结果 : 


(8) 对 每 个 d， 取 得 CD 信息 ， 插 入 到 QListView 中 ， 并 获取 这 个 
CD 的 所 有 曲目 : 


(9) 当 addcd_action 菜 单项 或 工具 栏 按钮 被 激活 时 ，AddCd 酸 将 
被 调用 : 


AdéCdDialog "dialog = new AddCdDialog(this),; 


CD Database 


tiie Help 


(9) 


Search Text Pink 
| rite Artist Catalogue 
« Dark Side of the Moon Pink Floyd 9000024D4 
~ Wish You Were Here Fink Floyd 8000024D45 
“Track 1 Shine on you crazy diamond 
Track 2, Welcome to the machine 
Track 3. Have a cigar 
Track 3. Wish you were here 
Track 5. Shine on you crazy diamond pt 2 


Displaying 2 result(s) for search string ' Pink ' 


图 17-13 


17.7.2 AddCdDialog 


要 向 数据 库 中 添加 CD ， 你 需要 编写 一 个 对 话 框 ， 对 话 框 中 有 一 些 
需要 输入 的 字段 。 
(1) 输入 以 下 代码 ， 将 它 命 名 为 AddCdDialog.h。 注 意 : 
AddCdDialog 继 承 自 KDialogBase (一 个 KDE 对 话 框 构件 ) ° 


include <kde/kdialoghbase.h> 
#include <qlineedit .h> 


class AddCdDialog public KDialogBase 
Q OBJECT 


public 
AddCdDialog (QWidget *parent!; 


private: 
QLineEdit *artist entry, *title entry, *catalogue entry; 


public slota: 
void okClicked|!: 


(2) 接 下 来 是 AddCdDialog.cpp © YE okClicked # H 4 JH T 
MySQL 接 口 代码 的 add_cd: 


Sinclude *'AddCdDialog.h* 
include ‘app_umyeq! hb” 


Sinclude «qiayout.h» 
$include «glabel.h» 


AddácáDialog::AddCdDialog| QWidget *parent} 
: KDialogBase| parent. *AddCD*, falge, "Add CD", 
KDialogBase::Ok|KDialogBMage::rCancel, KDialogBase:r:Ok, true ) 


QWidget "widget = new QWidgetithis]: 
getMainWidget (widget); 


QcridLayout ‘grid = new QGridLayout (widger,3,2,10, $,*grid*!: 


grid->addWidgetinew QLabel(*Artist*, widget, “artistlabel"), 0, 6, 9): 
grid->addWidget (new QLabel[*Title*, widget, “titlelabel*}, 1, 6, 0]: 
grid->addWidget [new Glabel {*Catalogue’. widget. *cataloguelabel*}. 2. 0. 9): 


artist entry s new QLineEdit| widget, "artist entry*):; 
title entry = new QLineEdit| widget, *'title entry"): 
catalogue entry = new QLineEdit| widget, “catalogue entry") | 


grid-»adgWidger|artist entry. 0.1, 0): 
grid-»addWidget!title entry, 1,1. 0): 
grid-»addWidget(catalogue entry. 2.1, 0]; 


connect (this, SIGNAL(okCiicked[]), rhis, SLOT (okCiicked())); 
} 


void AóddcdDlalog::okClicked!! 
{ 

char artist [200]; 

char title[290]; 

char cataloguel200]11 

int cd id = 0; 


strcpylartist, artist entry-»texti)]:; 
strcpy[titie, title entry-»text ()2; 
strcpy|catalogue, catalogue entry-»text(]); 
add. cd|artist, title, catalogue, &cd idli 


图 17-14 显 示 了 AddCdDialog 的 运行 结果 。 


Artist ‘Spinal Tap 


Title (Smell the Glove 


Catalogue [50000564F] | 


n 
iw" OK || 3X Cancel | 


Al 17-14 


17.7.3 LogonDialog 


当然 ， 你 在 没有 登录 数据 库 的 情况 下 是 不 能 查询 它 的 ， 所 以 你 需 
i — ha MEER RM ASR e A * RN HIRT RM A 
LogonDialog ° 

(1) EL 72% X FF LogonDialog.h ° 注意 : 为 了 寻求 变化 ， 这 里 
pede ens ze KDialogBase ° 


` alog. h> 
lude « di ii 
= LogonDialog public QDialog 
OBJE 
ogc (Widget t t ane ) 
String tUsername() 
tr aseword() 


OLineEdit *username_entry. *password entry: 


(2) 这 次 ， 你 有 更 好 的 方法 来 管理 用 户 名 和 密码 ， 而 不 是 在 
LogonDialog.cpp 中 封装 database_start 调 用 ， 下 面 是 LogonDialog.cpp 的 
r 


finclude *LogonDialog.h* 
finclude "app mysqi.h* 


finclude «qpuahbutton.bh» 
finclude <qlayout.h> 
finclude «gliabel.h» 


LogonDialog::Logontialog| QWidget *parent, const char *name): QDialogiparent, name) 
{ 
QGridLayout *grid * new QGridLayout(this, 3, 2, 10, 5,*grid*): 


grid-»addWidgeti(new QLabel(*Username*, this, "usernamelabel*), 0, 0, 0); 
grid-»addWidgetinew QLabel("Password', this. "'passwordlabel*), 1, 0. Oly 


username entry = new QLineEdit( this, "username entry"); 
password entry = new QLineEdit| this, "password entry*); 
password entry-»aetEchoMode [(GQLineEdiít::Password] ; 
grid-»addWidget(username entry, © 
grid-»addWidgetipassword entry, 1, 


e c 


QPushButton *button = new QPushButton (*Ok*, this, *button"); 
grid-»addWidget(button, 2, 1£,Qt::AlignRight); 


connect (button, SIGNALIClícked|!] this, SLOTIacceptí]]!; 


QString LoganDialog: :getUsername ( 


if (username entry == NULL) 
return NULL; 


return üsernare entry-»rext()1! 
) 


QString LogonDialog::getPasswordl) 
( 


if [password entry == NULL) 
return NULL; 


return password entry-»text|()!; 


} 
其 运行 结果 见 图 17-15。 


图 17-15 


17.7.4 main.cpp 


现在 只 剩 下 main 函 数 未 编写 了 ， 你 把 它 放 在 一 个 单独 的 源 文件 
main.cpp 中 
(1) 在 main.cpp 中 ， 你 先 打开 一 个 LogonDialog ， 然 后 通过 
database_start 登 录 。 如 有 果 登 录 失 败 ， 束 将 显示 一 个 QMessageBox， 或 
AURAI E Hi LogonDialog, SOLER IRI FP Ze RR E R UH 


*ap S AE h* 
finclude *LogonDialog.h* 


$include «kde/kapp.h» 
Sinclude «qmessagebox.h» 


int main! int argo, char **argv ) 
{ 

char userrame[100]; 

char password(100]; 


KApplication al arge, argv, 'cdapp* }; 
LogonDialog *dialog = new LogonDialog() 


while [1] 
{ 
if (dislog->exec|) == QDialog: :Accepted 


strcpy(username, dialog->getUsernanme!)}; 
strcpy (password, dialog->cgetPassword |) } 


if (database start (username, password!) 
break; 


. 
Titie* 


QMenaageBox:: informsticn (5, 
‘Could not oaiiy Check username and/or password’, 
QMessageBox: :Ok] ; 


continue 


if (QMessageBox::information(0, ‘Title’, 
"Are you sure you want to quit?*', 
OMessageBox::Yes, QMessageBox: ;No 
we (Measagebox: : Yen) 
return 9; 
) 
delete dialog; 


MainWindow *window = new MainWindow| “cd App* ); 
window-»resize| 600, 400 ); 


4.GetMainWidget! window ] 
window-»show|]: 


return a.execi); 


(2) RPM Rte S proxctt, HEE REA qmake ° XP ICE 
名 为 cdapp.pro: 


PS 


BIE 
NCL kde lude;/m, 
QMAK it 
MAK b/mysq 
QMAKE LIBS Xll += -lkdeui -lkdecore -Imysqgiclient 
SOURCES = MainWindow.cpp main.cpp app mysql.cpp AddCdDialog.cpp LogonDialog.cpp 
HEADERS = MainWindow.h app mysgl.h AddCdDialog.h LogonDialog.h 


注意 : 这 里 你 只 是 将 app_mysql.c 改 名 为 app_mysql.cpp 3X 
样 它 将 被 看 做 为 一 个 普通 的 C++ 源 文 件 。 这 可 以 避免 将 C 语 言 的 
目标 文件 链接 到 C++ 市 来 的 磋 烦 。 


$ qmake cdapp.pro -o Makefile 
$ make 
5 ./app 


如 果 一 切 正常 ， 你 的 CD 数据 库 应 用 程序 就 制作 完成 了 | 

你 可 能 想 和 尝试 用 MySQL 接 口 实现 其 他 功能 (如 向 CD 中 添加 曲目 
或 删除 CD) ， 来 进一步 了 解 KDE/Qt。 你 可 以 创建 对 话 框 、 新 的 菜单 
项 和 工具 栏 项 ， 以 及 编写 底层 逻辑 。 尽 管 去 尝试 吧 ! 


17.8 小结 


在 本 章 中 ， 你 学 习 了 如 何 使 用 Qt GUI 过， 并 看 到 了 KDE 构 件 的 使 
用 情况 。 你 了 解 到 Qt 是 一 个 用 信和 号/ 柳 机 制 来 实现 事件 驱动 编程 的 
C++ 库 。 还 学 习 了 基本 的 Qt 构件 ， 并 且 编 写 了 一 些 示 例 程 序 ， 了 解 了 
如 何在 实际 情况 中 使 用 它们 。 最 后 ， 你 用 KDE/Qt 实 现 了 一 个 CD 应 用 
程序 的 GUI 前 端 。 


18 Linuxi 


于 inux 网 开始 的 时 候 仅仅 只 是 一 个 内 核 ， 但 内 核 本 身 并 不 是 非常 
有 用 。 我 们 还 需要 许多 其 他 有 用 的 程序 ， 例 如 登录 系统 的 程序 、 管 理 
文件 的 程序 、 编 译 器 等 。 为 了 使 Linux 系 统 变 得 更 加 有 用 ， 许 多 GNU 
项 目的 工具 被 添加 进来 。 它 们 都 是 当时 在 UNIX 和 类 UNIX 系 统 中 非常 
流行 的 程序 的 克隆 版 本 。 将 Linux 系 统 变 得 与 UNIX 非 常 相似 设置 了 
Linux 的 第 一 个 标准 ， 它 为 C 语 言 程 序 员 提 供 了 一 个 非常 熟悉 的 环境 。 

不 同 的 UNIX (及 其 后 的 Linux) 厂商 为 他 们 所 提供 的 命令 和 工具 
添加 了 一 些 专 有 的 扩展 ， 而 且 它们 所 使 用 的 文件 系统 布局 之 间 也 有 一 
些 细微 的 差别 。 这 使 得 创建 可 以 在 多 个 系统 中 正常 工作 的 应 用 程序 变 
得 很 困难 。 更 糟 的 是 ， 程 序 员 甚至 不 能 指望 不 同 的 系统 会 以 相同 的 方 
式 提供 系统 工具 或 配置 文件 在 不 同 的 系统 中 都 位 于 同一 个 位 置 。 

很 显然 ， 我 们 必须 要 建立 一 些 标准 以 避免 UNIX 系 统 的 分 化 ， 目 
前 已 经 完成 了 一 些 优秀 的 UNIX 标 准 化 工作 o 

不 仅 这 些 标准 在 随 着 时 间 不 断 发展 ， 而 且 Linux 上 自身 也 在 随 着 网 
络 社 区 〈 通 常 由 商业 组 织 如 Red Hat 和 Canonical， 甚 至 包括 非 Linux 三 
商 如 IBM 所 支持 ) 的 推动 而 以 惊人 的 速度 不 断 增 强 。 在 发 展 的 过 程 
中 ，Linux 和 GCC 编译 器 集 不 仅 保持 与 相应 标准 的 一 致 ， 而 且 在 既 有 
标准 不 满足 需要 时 ， 还 会 有 新 的 标准 推出 。 事 实 上 ， 随 着 Linux 及 其 
相关 工具 和 实用 程序 变 得 越 来 越 流行 ，UNIX 厂 商 已 开始 对 他 们 的 
UNIX 系 统 做 出 修改 ， 以 使 它们 与 Linux 兼 容 性 更 好 。 

在 本 书 的 最 后 一 章 中 ， 我 们 将 介绍 这 些 标准 。 我 们 还 将 给 出 一 些 
注意 事项 ， 以 便 让 你 编写 的 应 用 程序 不 仅 可 以 在 自己 的 Linux 系 统 
(包括 以 后 的 升级 版 本 ) 中 运行 ， 而 且 可 以 移植 到 其 他 Linux 版 本 ， 
甚至 其 他 类 UNIX 系 统 中 ， 从 而 与 其 他 用 户 分 享 。 

我 们 将 主要 介绍 以 下 几 方面 内 容 。 

口 、C 编 程 语言 标准 。 


O _ UNIX 标准， 特别 是 由 IEEE 开 发 的 POSIX 标 准 ， 以 及 由 开放 

组 织 (OpenGroup) 开发 的 单一 UNIX 规 范 。 

口 由 自由 标准 组 织 (Free Standard Group) 所 做 的 工作 ， 特 别 

是 Linux 标 准 化 规范 (Linux StandardBase) ， 它 定义 了 标准 的 

Linux 文 件 系 统 布 局 。 

了 解 Linux 相 关 标 准 的 一 个 好 起 点 是 Linux 标 准 化 规范 (LSB) ， 
你 F 以 通过 访问 Linux 基 金 会 网 站 http: //www.linux-foundatjon.org ¥ 
找到 它 。 

我 们 并 不 准备 详细 介绍 这 些 标准 的 内 容 ， 其 中 许多 标准 的 内 容 篇 
幅 太 长 。 我 们 将 指出 一 些 关 键 标准 ， 并 介绍 这 些 标准 发 展 的 历史 背 
景 ， 以 及 告诉 你 哪些 标准 对 你 有 用 。 


18.1 C 编 程 语言 


C 语 言 是 Linux 编 程 语言 事实 上 的 标准 ， 所 以 为 了 在 Linux 上 编写 
可 移植 的 C 语 言 程 序 ， 我 们 需要 了 解 一 些 C 语 言 的 起 源 ， 它 是 如 何 发 展 
的 ， 而 更 重要 的 是 如 何 检查 程序 来 保持 和 标准 的 一 致 。 


18.1.1 H 


那些 对 历史 不 感 兴 趣 的 读者 无 需 担 心 ， 因 为 本 书 是 介绍 编程 ， 而 
不 是 讲述 历史 ， 所 以 我 们 只 是 简单 介绍 C 语 言 的 发 展 历史 。 

C 编 程 语言 诞生 于 20 世 纪 70 年 代 ， 它 部 分 基于 早先 的 编程 语言 
BCPL， 并 对 B 语 言 进 行 了 扩展 。DennisM.Ritchie 在 1974 年 为 该 语言 写 
了 一 个 参考 手册 ， 同 一 时 间 ， 对 PDP-11 机 器 上 的 UNIX 内 核 的 改写 也 
是 以 C 语 言 为 基础 的 。1978 年 ，BrianW.Kemighan 和 Ritchie 写 了 一 本 
经 典 的 C 语 言 参考 书籍 《C 编 程 语言 》 (C Programming Language) ， 
BRL eee 了 更 新 ， 直 至 今日 ， 这 本 书 还 在 不 断 

J o 

C 话 言 如 此 快速 地 流行 起 来 ， 训 无 疑问 这 里 面 有 部 分 原因 应 归功 
于 UNIX 用 户 的 快速 增加 ， 但 也 与 其 自身 强大 的 功能 和 清晰 的 语法 分 
不 开 。C 语 言 的 语法 根据 开发 者 的 共识 也 在 不 断 发 展 ， 但 既然 它 与 原 
先 参考 书籍 中 所 描述 的 语言 分 歧 越 来 越 大 ， 很 明显 我 们 需要 一 个 标 
准 ， 它 既 符 合 当 前 的 应 用 ， 又 更 加 精确 。 

1983 年 ，ANSI 建 立 了 X3J11 标 准 委员 会 来 开发 一 个 清晰 、 人 简明 的 
C 语 言 定义 。 在 开发 的 过 程 中 ， 他 们 对 C 语 言 做 了 稍 许 的 改进 ， 特 别 是 
增加 了 一 个 非常 受 欢迎 的 功能 一 一 声明 参数 类 型 ， 但 总 的 来 说 ， 委 员 
会 只 对 构成 C 语 言 常见 用 法 的 已 有 定义 做 了 阐明 和 合理 化 。 这 个 标准 
最 终 在 1989 年 发 表 了 ， 它 被 称 为 ANSI C 编 程 语言 标准 X3.159-1989， 
或 简称 为 C89， 有 时 又 被 称 为 C90 〈 后 者 后 来 成 为 ISO C 编 程 语言 标准 
ISO/IEC 9899:1990。 这 两 个 标准 在 技术 上 是 相同 的 ) 。 

如 同 大 多 数 标准 一 样 ， 这 个 标准 的 发 表 并 未 结束 委员 会 的 工作 ， 
他 们 继续 努力 以 阐明 在 规范 中 发 现 的 小 的 差异 。1993 年 ， 委 员 会 又 开 
制定 下 一 个 版 本 的 标准 ， 即 C9X。 同 时 ， 他 们 还 针对 当前 的 标准 陆 
续 在 1994、1995 和 1996 年 发 表 了 小 的 修正 和 更 新 。 

这 个 标准 的 最 新 版 本 出 现在 20 世 纪 90 年 代 ， 它 正式 成 为 C99 标 准 
并 被 ISO 采纳 ， 成 为 ISO/AEC 9899:1999。 目 前 还 有 一 个 工作 委员 会 J11 


在 继续 进行 C 语 言及 其 函数 库 的 标准 化 研究 ， 但 它 现 在 是 在 国际 委员 
会 下 为 信息 技术 标准 组 工作 。 你 可 以 通过 网 址 http:/Wj11.incits.org/ 花 到 
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18.1.2 ”GNU 编 译 器 集 


开发 了 Emacs 编辑 器 (是 的 ， 我 们 爱 Emacs) 后 ，GNU 项 目的 下 
一 个 主要 成 就 (正如 我 们 在 第 1 革 讨 论 的 ) 是 一 个 完全 免费 的 C 语 言 编 
译 絮 gcc， 它 的 第 一 个 正式 版 本 发 表 于 1987 年 。 

gcc 最 初 只 是 一 个 GNU C 语 言 的 编译 器， 但 由 于 目前 该 编译 句 的 
基本 框架 已 支持 Ct++、Object-C、FORTRAN、Java 和 Ada 等 许多 其 他 
MIRE A BU 所 以 对 gcc 的 定义 被 修改 为 更 合适 的 GNU 编 译 
Ane ° 

gcc 始 终 是 ， 并 且 看 来 以 后 也 将 会 是 Linux 上 的 标准 编译 妖 ， 并 且 

C 或 C++ 语言 也 是 Linux 上 程序 设计 的 基本 语言 。 更 多 信息 可 参见 gcc 的 
主页 http:/gcc.gnu.org。 

GNUC 语 言 编译 器 总 是 非常 好 地 你 持 与 C 语 言 标准 开发 进度 的 一 
致 ， 同 时 它 也 允许 一 些 扩展 功能 ， 并 且 不 可 避免 地 像 所 有 其 他 编译 器 
一 样 ， 在 标准 正式 推出 和 编译 圳 完 全 实现 该 标准 之 间 有 稍微 的 延迟 。 
但 有 时 也 会 出 现 相 反 的 情况 ，gcc 期 望 标准 能 稍 作 一 些 修改 ， 这 一 点 也 
让 人 非常 困惑 。gcc 包 含 许多 命令 行 命令 和 选项 ， 它 们 允许 你 指定 希望 
EO QE DA Pe ill Sia o m FREE DANI BI TRE 
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18.1.3 gcc 选项 


在 了 解 了 一 些 C 语 言 标 准 发 展 的 背景 之 后 ， 现 在 我 们 来 查看 gcc 编 
译 絮 提供 的 一 些 选项 ， 它 们 可 以 用 来 确保 我 们 所 编写 的 C 语 言 程序 古 
完全 遵守 该 语言 的 标准 的 。 我 们 可 以 用 3 种 方法 来 确保 编写 的 C 语 言 代 
码 不 仅 遵 守 标 准 ， 而 且 还 是 代码 清晰 的 。 它 们 是 : 用 可 以 控制 标准 版 
本 的 选项 来 指定 我 们 期 望 代码 兼容 的 标准 版 本 ; 定义 用 来 控制 头 文 件 
的 常量 ， 用 警告 选项 对 代码 进行 更 严格 的 检查 。 

gcc 编 译 器 包含 有 大 量 的 选项 ， 在 这 里 ， 我 们 将 只 介绍 那些 最 重要 
的 选项 。 完 整 的 选项 列表 可 以 在 gcc 手 册页 中 找到 。 我 们 还 将 简单 介绍 
一 些 可 以 使 用 的 #define 选 项 ， 它 们 通常 必须 在 源 代码 中 的 任何 #include 
语句 之 前 设置 或 在 gcc 命 令 行 上 定义 。 你 可 能 会 感到 惊讶 ， 为 什么 需要 
用 这 么 多 选项 来 选择 一 个 要 使 用 的 标准 ， 而 不 能 只 用 一 个 标记 来 强制 


使 用 当前 的 标准 呢 ? 原因 是 ， 由 于 许多 以 前 的 程序 依赖 编译 器 的 历史 
行为 ， 如 果 要 将 它们 全 部 更 新 到 遵守 最 新 的 标准 ， 我 们 需要 付出 巨大 
的 努力 ， 并 且 我 们 并 不 希望 编译 器 升级 以 后 就 不 再 支持 以 前 可 以 正常 
工作 的 代码 ， 而 且 随 着 标准 的 发 展 ， 我 们 希望 编译 器 能 够 针对 特定 的 
标准 正常 工作 ， 即 使 它 并 不 是 最 新 版 本 的 标准 。 

即使 仅仅 是 为 个 人 使 用 而 编写 一 个 小 的 程序 ， 在 这 种 情况 下 ， 虽 
然 让 程序 遵守 标准 显得 并 不 是 那么 重要 ， 但 仍然 值得 在 编译 时 启用 更 
多 的 gcc 警 告 选项 ， 因 为 这 样 可 以 让 编译 器 在 真正 运行 程序 之 前 找 出 程 
序 代码 中 的 错误 。 与 使 用 调试 器 以 步 进 的 方式 来 查找 代码 问题 相 比 ， 
使 用 这 种 方式 更 有 效率 。 编 译 器 包括 很 多 选项 ， 它 们 的 功能 不 仅仅 只 
是 检查 代码 是 否 遵 守 标 准 的 规定 ， 而 且 还 可 以 检查 出 虽然 遵守 标准 但 
可 能 包含 歧义 的 代码 。 例 如 ， 代 码 中 可 能 存在 一 个 执行 序列 ， 它 将 人 允 
许 变量 在 未 初始 化 之 前 就 被 访问 。 

如 果 确 实 需要 将 编写 的 代码 与 他 人 分 享 ， 除 了 在 编译 时 选择 需要 
遵守 的 标准 版 本 和 合适 的 警告 选项 外 ， 还 有 非常 重要 的 一 点 是 ， 要 努 
力 确保 你 的 代码 在 编译 时 没有 任何 警告 信息 出 现 。 如 果 你 在 编译 时 允 
许 出 现 一 些 警 告 信息 并 且 养 成 习惯 名 略 它们 ， 那 么 当 有 一 天 在 编译 时 
出 现 非常 严重 的 警告 信息 时 ， 你 也 可 能 会 把 它 忽略 。 如 果 代 码 在 编译 
时 永远 都 保持 整洁 ， 那 么 当 出 现 新 的 警告 信息 时 ， 它 就 会 显得 非常 明 
显 。 我 们 应 该 养 成 保持 编译 代码 整洁 的 习惯 。 

1. 控制 标准 版 本 的 编译 选项 
ge ee le | 
WEM ° 

O -ansi: 这 是 最 重要 的 标准 选项 ， 它 告诉 编译 器 遵守 C 语 言 的 

ISO C90 标 准 。 它 关闭 那些 与 标准 不 兼容 的 gcc 扩 展 ， 禁 用 C 语 言 

程序 中 的 C++ (/) 风格 注释 ， 并 启用 ANSI 的 三 字母 词 

(trigraph) 特性 。 同 时 通过 定义 宏 _STRICT_ANSI 来 关闭 在 头 文 

件 中 与 标准 不 兼容 的 一 些 gcc 扩 展 。 未 来 的 编译 器 版 本 可 能 会 修改 

这 个 选项 指向 的 C 语 言 标 准 。 

O -std=: 通过 这 个 选项 可 以 对 使 用 的 标准 进行 更 精细 地 控制 ， 

它 通过 使 用 一 个 参数 来 设置 需要 的 标准 。 其 主要 的 选项 如 下 所 

7e 


m c89: 支持 C89 标 准 。 

m iso9899:1999: 支持 最 新 的 ISO C90 标 准 。 

m onu89: 支持 C89 标 准 ， 但 同时 支持 GNU 的 扩展 和 一 些 C99 特 
性 。 对 于 gcc 的 4.2 版 本 来 说 ， 这 是 默认 行为 。 


通 
=. 
里 


N 
y 
o 


项 。 


过 


2. 控制 标准 版 本 的 常量 
XU mf (#define) 可 以 通过 编译 器 的 命令 行 选 项 来 设置 ， 或 者 
源 代 码 中 的 #define 语 句 来 定义 。 我 们 通 稼 建议 用 前 者 设置 这 些 种 


O STRICT ANTI :强制 使 用 C 语 言 的 ISO 标准 。 这 个 常量 在 使 用 
编译 器 的 命令 行 选项 -ansi 时 被 定义 。 

O POSIX C SOURCE-2: 启用 由 IEEE Std 1003.1 和 1003.2 标 准 
定义 的 特性 。 我 们 还 会 在 本 章 后 面 的 内 容 中 谈 到 这 些 标准 。 

O  BSD SOURCE: 启用 BSD 类 型 的 特性 。 如 果 这 些 特性 与 
POSIX 定 义 冲 突 ， 则 以 BSD 的 定义 为 准 。 

O GNU SOURCE: 启用 大 量 特性 ， 其 中 包括 GNU 扩 展 。 如 果 
这 些 特 性 与 POSIX 定 义 冲 突 ， 则 以 POSIX 定 义 为 准 。 

3. 编译 器 的 警告 选项 

这 些 选 项 在 编译 器 的 命令 行 上 传递 。 我 们 在 下 面 只 列 出 主要 的 选 
完整 的 选项 列表 可 以 在 gcc 的 手册 页 中 找到 。 

O -pedantic: 这 是 用 于 检查 C 语 言 代码 的 功能 最 强大 的 编译 右 选 
项 。 它 除了 启用 用 于 检查 代码 是 否 遵守 C 语 言 标 准 的 选项 外 ， 还 
关闭 了 一 些 不 被 标准 允许 的 传统 C 语 言 结 构 ， 并 且 禁 用 所 有 的 
GNU 扩 展 。 如 果 你 希望 代码 能 够 尽 可 能 地 做 到 可 移植 ， 就 需要 使 
用 这 个 选项 。 这 个 选项 的 缺点 是 ， 它 在 检查 代码 时 显得 非常 挑 
5l. 有 时 你 不 得 不 非常 仔细 地 思考 ， 以 去 除 那些 最 后 的 警告 信 
O -Wformat: 检查 printf 系 列 函数 所 使 用 的 参数 类 型 是 否 正确 。 

O -Wparentheses: 检查 是 否 总 是 提供 了 需要 的 圆 括 号 ， 即 使 在 
某 些 环境 中 并 不 是 必须 要 使 用 它们 。 当 想 要 检查 对 一 个 复杂 结构 
的 初始 化 是 否 按照 预期 进行 时 ， 这 个 选项 就 很 有 用 。 

O -Wswitch-default: 检查 是 否 所 有 的 switch 语 句 都 包含 一 个 
default case， 这 通常 是 一 个 好 的 编码 习惯 。 

O -Wunused: 检查 诸如 声明 静态 函数 但 没有 定义 、 未 使 用 的 参 
数 和 丢弃 返回 结果 等 情况 。 

o -Wall: 启用 绝 大 多 数 gcc 的 警告 选项 ， 包 括 所 有 以 -W 为 前 级 的 
选项 (不 包括 选项 -pedantic) ， 这 个 选项 对 保持 代码 的 整洁 很 有 


用 。 
gcc 还 包括 许多 警告 选项 ， 详 细 情 况 请 阅读 gcc 的 网 页 。 一 般 来 
说 ， 我 们 建议 使 用 选项 -Wall， 它 在 检查 代码 质量 和 不 让 编译 帮 生 
成 太 多 的 珊 碎 警告 之 间 达 到 了 很 好 的 平衡 ， 因 为 要 清除 掉 这 些 琐 
碎 的 警告 需要 耗费 程序 员 太 多 的 精力 。 


18.2 DLSB 


现在 我 们 将 讨论 比 C 语 言 代码 高 一 个 层次 的 由 操作 系统 提供 的 接 
O (系统 函数 ) 。 这 一 级 别 的 标准 化 工作 由 下 面 两 个 组 件 构成 : 由 画 
数 库 提 供 的 函数 和 由 底层 的 操作 系统 提供 的 系统 调用 。 在 这 两 个 组 件 
之 中 又 分 别 包含 两 个 层次 的 细节 : 提供 的 是 哪 一 个 接口 和 接口 的 定 


义 。 

在 这 一 领域 的 针对 Linux 的 权威 性 文档 是 LSB， 你 可 以 在 
http://www.linuxbase.org 或 http://www.linux-foundation.org/en/LSB 上 找到 
它 。 该 标准 已 发 布 了 多 个 版 本 ， 其 工作 还 正在 进行 之 中 。 

你 可 以 在 http:/www.linux-foundation.org/en/products 上 找到 通过 验 
证 的 Linux 发 行 版 列表 。RedHat、SUSE 和 Ubuntu 的 各 种 版 本 都 通过 了 
验证 ， 但 请 记 住 ， 一 个 发 行 版 在 发 布 之 后 需要 经 过 一 段 时 间 的 测试 来 
通过 验证 。 这 个 站 点 还 列 出 了 正 处 于 测试 中 的 发 行 版 ， 以 及 需要 进行 
一 些 更 新 才能 通过 验证 测试 的 发 行 版 。 

Linux 标 准 化 规范 (版 本 3.1) 定义 了 3 个 需要 遵守 的 领域 。 

口 核心 : 主要 的 函数 库 、 工 具 和 一 些 重要 的 文件 系统 位 置 。 

O C++: ”C++ 函数 库 。 

口 桌面 : 用 于 吕 面 安装 的 其 他 文件 ， 主 要 是 各 种 图 形 库 。 

我 们 感 兴趣 的 主要 领域 是 这 个 规范 的 核心 部 分 。 

LSB 规 范 在 其 自身 的 文档 中 泗 盖 了 许多 领域 ,同时 它 还 引用 了 一 
些 针对 特定 接口 定义 的 外 部 标准 。 其 涵盖 的 领域 包括 : 

可 兼容 二 进 制 程序 的 对 象 格式 ; 

动态 链接 标准 ; 

标准 函数 库 ， 包 括 基础 函数 库 和 X 视 窗 系 统 函 数 库 ; 
shell 和 其 他 命令 行程 序 ; 

执行 环境 ， 包 括 用 户 和 组 ，; 

O “系统 初始 化 和 运行 级 别 。 

在 本 章 中 ， 我 们 只 对 标准 函数 库 、 用 户 和 系统 初始 化 感 兴趣 ， 所 
以 这 也 是 下 面 将 要 介绍 的 内 容 。 


18.21 LSB 标 准 函 数 库 


LSB 定 义 了 必须 以 两 种 方式 圣 现 的 接口 。 对 于 那些 主要 是 由 GNU 
C 玉 数 库 实现 的 或 试图 成 为 Linux 专 属 标准 的 钞 数 ， 它 定义 接口 及 其 行 
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为 。 对 于 主要 来 目 UNIX 系 统 的 其 他 接口 ， 规 范 只 是 说 明 必 须 存 在 一 个 
特定 接口 ， 并 且 该 接口 的 行为 必须 与 其 他 标准 定义 的 一 样 ， 这 里 所 说 
的 其 他 标准 通常 指 的 是 公共 应 用 环境 (Common Application 
Environment, CAE) 或 更 常见 的 单一 UNIX 规 范 (Single UNIX 
Specification) 。 后 者 的 网 址 为 http:/www.opengroup.org， 其 中 一 部 分 
内 容 可 以 通过 http:/www.unix.org/online.html (需要 注册 ) 访问 。 

但 遗憾 的 是 ，Linux 的 压 层 标准 ， 即 UNIX 标 准 的 历史 非常 复杂 ， 
存在 相当 多 的 标准 可 供 选 择 ， 虽 然 其 中 大 部 分 标准 的 不 同 版 本 之 间 的 
兼容 性 都 很 好 。 

1. UNIX 标准 历史 简介 

UNIX 诞 生 在 20 世 纪 60 年 代 末 的 AT&T 公 司 的 贝尔 实验 室 。 最 初 ， 
Ken Thompson 和 Dennis Ritchie 只 是 处 于 个 人 使 用 的 目的 编写 了 一 个 操 
作 系 统 并 将 其 命名 为 Unics ， 不 知 何 故 这 个 名 字 后 来 又 被 更 名 为 
UNIX。AT&T 公 司 允 许 大 学 获取 该 操作 系统 的 源 代 码 来 进行 研究 ， 并 
且 由 于 UNIX 非 常 整洁 的 设计 和 强大 的 概念 ， 它 很 快 就 变 得 非常 流行 。 
UE E 因为 它 允 许 人 们 对 其 进行 修改 

[实验 。 

BSD 操 作 系 统 作为 UNIX 系 统 的 一 个 分 文 ， 由 加 州 大 学 伯克利 分 核 
开发 ， 其 中 的 许多 工作 主要 集中 在 操作 系统 的 网 络 功能 上 。 

当 AT&T 公 司 在 20 世 纪 80 年 代 中 期 开始 将 UNIX 系 统 商 业 化 时 ， 它 
对 其 发 布 的 UNIX 系 统 进行 了 命名 ， 其 中 最 流行 的 一 个 版 本 是 UNIX 
System V ° 

与 此 同时 ， 也 出 现 了 许多 其 他 的 UNIX 分 支 ， 数 量 太 多 ， 我 们 就 不 
在 这 里 一 一 列 出 了 。 这 些 UNIX 分 文 都 与 UNIX 基 本 的 标准 有 些 细微 的 
区 别 并 增加 了 一 些 功能 ， 因 为 公司 一 般 都 会 党 试 通过 私有 扩展 来 增加 
操作 系统 的 功能 。 

1994 年 ， 当 AT&T 决 定 退 出 UNIX 产 业 并 将 它 的 UNIX 系 统 实验 室 
卖 给 Novell 公 司 之 后 ， 情 况 开 始 变 得 真正 复杂 起 来 ，UNIX 商 标的 所 有 
权 变 得 有 些 混乱 ， 并 成 为 了 各 种 诉讼 案件 的 主题 。1988 年 ，IEEE 

(http://www.ieee.org) 发 表 了 一 系列 UNIX 标 准 中 的 第 一 个 标准 POSIX 

(又 被 称 为 IEEE1003 标 准 ) ， 它 试图 成 为 权威 性 的 针对 计算 机 环境 的 
可 移植 接口 规范 。 虽 然 它 是 一 个 好 的 、 定 义 明确 的 标准 ， 但 同时 它 也 
是 一 个 非常 核心 的 规范 并 且 它 所 涵盖 的 范围 也 非常 有 限 。 

1994 年 ，X/OPEN 公 司 作为 一 个 厂商 中 立 的 机 构 ， 发 表 了 一 组 较 
大 规模 的 规范 X/OPEN CAE (又 被 称 为 公共 应 用 环境 ) ， 它 是 IEEE 
POSIX 标 准 的 一 个 超 集 并 且 从 技术 角度 来 说 有 很 多 领域 与 它 相 同 。 
X/OPEN 公司 后 来 和 OSF 合 并 成 立 了 Open Group， 它 的 网 址 是 


http:/www.opengroup.org/。CAE 标 准 在 2002 年 被 更 新 并 以 单一 UNIX 规 
范 版 本 3 的 形式 由 Open Group 发 表 o l 
H — UNIX LG ze Linux EAE (EUG, fc BS — 1 AG. 。 


注意 ，“Linux” 是 一 个 由 Linus Torvalds 拥 有 的 商标 (JL 
http://www.linuxmark.org/) ° 


2. 针对 函数 库 使 用 LSB 标 准 

上 一 区 的 介绍 对 读者 了 解 UNIX 标 准 的 历史 已 经 足够 ， 但 这 对 那些 
希望 自己 编写 的 C 语 言 或 C++ 语言 ) 的 程序 可 移植 的 程序 员 来 说 意味 
Att AWE? 

BU. ae Soke BR A EA A ee BOOZE T LSBALYG ° JU 
A'ETUEÀX TALE FORTS A ER BAT BE AN 2 BBE RA 
植 ， 这 时 就 需要 查找 一 种 标准 的 方法 来 执行 你 想 要 完成 的 工作 。 你 可 
能 需要 用 Linux 命 令 apropos 来 搜索 在 线 手册 页 ， 以 找到 合适 的 帮助 页 


其 次 ， 也 是 更 困难 的 一 步 ， 融 是 检查 你 所 使 用 的 函数 行为 是 否 是 
规范 定义 的 行为 ， 并 且 没有 在 程序 中 依赖 系统 特定 的 函数 行为 。 如 果 
男 数 的 用 法 林 在 LSB 中 定义 ， 你 可 能 不 得 不 参考 单一 UNIX 规 范 来 检 


用 于 检查 未 定义 或 可 能 产生 错误 行为 的 函数 的 一 个 非常 好 的 方法 
是 使 用 Linux 的 在 线 手 册 。 手 册 中 的 许多 页 面 都 包含 一 个 BUGS (Ju 
洞 ; 小 节 ， 它 是 一 个 无 价 的 信息 来 源 。 它 可 以 告诉 我 们 ，Linux 中 的 某 
个 特定 函数 调用 可 能 没有 完全 按照 标准 中 的 定义 来 实现 ， 或 者 它 在 执 
行 时 有 一 些 已 知 的 漏洞 或 奇怪 的 行为 。 


18.2.2 LSB 组 


T 规范 中 这 一 部 分 的 内 容 非常 简明 且 容 易 理 解 。 下 面 是 一 些 规范 中 
定义 o 
O “ 它 告诉 我 们 ， 一 定 不 能 直接 读 取 如 /etcpasswd 这 样 的 文件 ， 而 
是 应 该 总 是 使 用 如 getpwent 这 样 的 标准 库 函 数 调 用 或 者 如 passwd 
这 样 的 标准 工具 来 访问 用 户 详细 信息 。 
口 “ 它 告诉 我 们 ， 在 root 组 中 必须 有 一 个 名 为 root 的 用 户 ， 这 个 root 
用 户 是 一 个 拥有 全 部 权限 的 管理 员 。 同 时 还 有 一 组 可 选 的 用 户 和 
Ore 中 使 用 ， 它 们 由 Linux 发 行 版 自身 来 


口 _ 它 还 告诉 我 们 ， 用 户 ID 小 于 100 的 账号 是 系统 账号 ， 用 户 ID 在 

100 到 499 之 间 的 账号 生 由 系统 管理 员 和 安 冯 后 脚本 分 配 的 ， 用 户 

ID 在 500 及 其 以 上 的 账号 用 于 普通 用 户 。 

一 般 来 说 ， 上 面 这 些 内 容 对 大 多 数 需 要 了 人 解 用 户 标准 的 Linux 程 序 
员 来 说 已 足够 。 


182.3 LSB 系统 id 
至 少 对 于 我 们 来 说 ， 系 统 初始 化 方面 的 内 容 总 是 一 件 在 不 同 Linux 
发 行 版 之 间 有 着 细微 区 别 的 让 人 烦恼 的 事情 。 


Linux 继 承 了 类 UNIX 操 作 系统 运行 级 别 的 思想 ， 运 行 级 别 定义 了 
在 不 同 级 别 中 人 允许 局 动 的 服务 。 对 于 Linux 来 说 ， 常 见 的 运行 级 别 定 义 


表 18-1 


un mulus mteTImogm Ty: s 


LSB 列 出 了 这 些 运行 级 别 ， 但 并 不 要 求 使 用 它们 ， 但 实际 上 它们 
是 非常 常见 的 。 

与 这 些 运行 级 别 相伴 的 是 一 组 用 于 启动 、 关 闭 和 重启 服务 的 初始 
化 脚本 。 以 前 的 Linux 系 统 会 将 这 些 脚 本 放 在 /etc 目 录 下 的 不 同位 置 ， 
一 般 是 放 在 目录 /etc/init.d 或 /etc/rc.d/init.d 下。 这 种 不 确定 性 通常 让 用 户 
困惑 ， 因 为 当 他 们 更 换 了 Linux 发 行 版 后 ， 他 们 惑 不 能 在 期 望 的 目录 下 
找到 初始 化 脚本 了 ， 而 且 在 安装 程序 时 ， 当 你 试图 将 初始 化 脚本 放 在 
一 个 错误 的 目录 下 时 ， 也 会 导致 安装 程序 失败 。 

LSB 3.1 将 这 些 初 始 化 脚本 放置 的 目录 定义 为 /etc/init.d， 但 它 也 允 
许 这 个 目录 可 以 是 对 其 他 目录 的 一 个 连接 。 

在 /etc/init.d 目 录 中 的 每 个 脚本 都 有 一 个 与 其 提供 的 服务 相关 联 的 
名 字 。 由 于 这 是 在 Linux 系 统 中 所 有 服务 必须 共享 的 一 个 公用 命名 空 
间 ， 所 以 保证 名 字 的 唯一 性 是 非常 重要 的 。 例 如 ， 如 采 MySQL 和 
PostgreSQL 都 决定 将 它们 的 脚本 命名 为 database， 那 么 情况 丈 会 变 得 比 
BIE AR oT ST ERR EIRP SE, RILA Ah ZA Ee, TW 
是 “Linux 分 配 名 字 和 数字 机 构 ”(Linux Assigned Names And Numbers 


Authority， 简 称 为 LANANA) ， 它 的 网 址 为 http://www.lanana.org/。 夷 
运 的 是 ， 你 不 需要 对 它 了 解 太 多 ， 只 需要 知道 它 维 护 了 一 个 已 注册 脚 
本 和 软件 包 名 字 列 表 ， 从 而 减轻 了 Linux 系 统 用 户 的 工作 负担 。 

初始 化 脚本 必须 用 一 个 参数 来 控制 它 的 行为 。 已 定义 的 参数 见 表 
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所 有 的 命令 在 成 功 时 返回 0， 失 败 时 返回 表明 错误 原因 的 错误 代 
码 。 使 用 status 参 数 时 ， 如 果 服 务 正在 运行 则 返回 0， 否 则 返回 表明 服 
务 没有 运行 原因 的 状态 码 。 


18.3 系统 层次 结构 标 ; 


在 本 章 中 我 们 要 介绍 的 最 后 一 个 标准 是 文件 系统 层次 结构 标准 
( Filesystem Hierarchy Standard, fH K A FHS) ， 它 的 网 址 为 
http://www.pathname.com/fhs/ ° 

这 个 标准 的 目的 是 定义 Linux 文 件 系 统 的 标准 路 径 ， 使 得 开发 者 和 
用 户 可 以 在 合理 的 位 置 找到 需要 的 东西 。 长 期 以 来 ， 使 用 不 同类 UNIX 
操作 系统 的 用 户 都 对 文件 系统 布局 的 细微 区 别 感到 无 茶 ， 而 FHS 辣 
Linux 发 行 版 提供 了 一 种 方法 来 避免 这 样 的 问题 。 

乍 看 起 来 ，Linux 系 统 中 的 文件 布局 好 像 是 对 文件 和 目录 基于 历史 
实践 的 一 种 比较 随意 的 安排 。 从 某 种 程度 上 来 说 ， 事 实 确实 如 此 ， 但 
这 种 布局 是 经 过 多 年 的 合理 演变 才 形 成 我 们 今天 见 到 的 构架 的 。 大 体 
的 想法 是 将 文件 和 目录 分 为 如 下 3 组 。 

O ”对 运行 Linux 的 某 一 特定 系统 唯一 的 文件 和 目录 ， 例 如 启动 脚 

本 和 配置 文件 。 

O ”可 以 在 运行 Linux 的 不 同系 统 之 间 共 至 的 只 读 文 件 和 日 录 ， 例 

如 可 执行 应 用 程序 。 

O ”可 以 在 运行 Linux 或 其 他 操作 系统 的 不 同系 统 之 间 共 至 的 可 读 

可 写 的 目录 ， 例 如 用 户 家 目录 。 

虽然 ， 在 一 个 由 Linux 机 铬 组 成 的 网 络 中 ， 确 保 只 有 一 份 主要 程序 
日 录 的 副本 ， 并 且 可 以 在 许多 机 姨 之 间 共 至 古 非常 好 的 做 法 ， 但 在 本 
书 中 ， 我 们 对 在 不 同 版 本 的 Linux 系 统 之 间 共 享 文件 并 不 是 太 感 兴趣 。 
这 种 做 法 只 对 无 盘 工 作 站 特别 有 用 。 

FHS 定 义 的 顶级 结构 包含 一 些 必须 存在 的 子 目录 和 一 小 部 分 可 选 
的 目 孙 ， 如 表 18-3 所 示 。 


表 18-3 


另外 ， 可 能 还 会 有 一 些 其 他 目 孙 也 以 jb 为 前 缀 ， 但 这 并 不 是 很 销 
见 。 你 通常 还 会 看 到 目录 /lost+found 〈 用 于 fsck 命 令 进 行文 件 系统 的 恢 
复 ) 和 目录 /proc， 后 者 其 实 是 一 个 伪 文 件 系统 ， 它 提供 了 对 当前 运行 
系统 的 一 个 映 映 。 当 前 的 FHS 标 准 提 到 了 /proc 文 件 系 统 ， 但 并 不 要 求 
它 一 定 存 在 。 虽 然 我 们 在 第 4 章 简 单 介绍 了 /proc 目 孙 ， 但 关于 它 的 细 
节 已 超出 了 本 书 介绍 的 范围 。 

下 面 ， 我 们 将 简单 介绍 根 目录 下 每 个 标准 子 目 录 的 用 途 。 

O bin: 包含 可 以 被 root 用 户 和 普通 用 户 使 用 的 二 进 制 文 件 ， 它 

们 都 可 以 在 单 用 户 模 式 下 运行 ， 即 在 其 他 一 些 目录 结构 还 未 装载 

的 情况 下 也 能 单独 运行 。 例 如 ， 核 心 命令 如 cat 和 ]s 都 可 以 在 这 里 

找到 ， 当 然 也 包括 命令 sh ° 

O /boot: 这 个 目录 下 放置 的 是 局 动 Linux 系 统 时 所 需 使 用 的 文 

件 。 这 些 文件 通常 都 比较 小 ， 文 件 长 度 不 超过 100MB。 我 们 通常 

会 为 这 个 目录 单独 划分 一 个 分 区 ， 在 基于 PC 的 系统 中 这 样 做 非常 

方便 ， 但 由 于 BIOS 通 常会 对 活动 分 区 有 所 限制 ， 所 以 需要 将 该 分 

区 分 配 在 磁盘 的 前 2G 或 4G 空 间 中 。 为 这 个 日 隶 单独 划分 一 个 分 

区 ， 可 以 使 我 们 在 决定 如 何 分 配 剩 余 的 位 副 空间 时 更 灵活 。 

O /dev: 这 个 目录 下 放置 的 是 映射 到 硬件 的 特殊 设备 文件 。 例 

Uf/dev/hda RI] Z| — IDE 4 23 » 

O /etc: 这 个 目录 下 放置 的 是 配置 文件 。 历 史上 有 些 二 进 制 文件 

也 放置 在 这 个 目录 下 ， 但 在 现在 的 大 多 数 Linux 系 统 中 都 不 会 再 出 

现 这 种 情况 。 在 /etc 目 录 下 最 有 名 的 文件 可 能 束 是 passwd 文 件 ， 它 

包含 系统 中 用 户 的 信息 。 其 他 有 用 的 文件 有 fstab ( 列 出 分 区 装载 

选项 ) ^ hosts 〈 列 出 耳 地 址 和 主机 名 的 映射 关系 ) ` httpd H X 

(包含 Apache 服 务 器 的 配置 文件 ) 。 


O /home: 这 是 用 于 放置 用 户 文 件 的 目录 。 正 常情 况 下 ， 每 个 用 

户 都 会 在 这 个 目录 下 有 一 个 与 他 们 的 登录 名 相同 的 子 目录 ， 而 这 

个 子 目 录 就 是 他 们 的 默认 登录 目录 。 例 如 ， 用 户 rick 在 登录 进 系 

统 后 ， 将 会 发 现 目 己 位 于 日 隶 /home/rick 中 。 

O /lib: 这 个 目录 下 放置 的 是 基本 的 共 诗 函数 库 和 内 核 模块 ， 特 别 

是 那些 在 系统 启动 或 系统 位 于 单 用 户 模 式 时 需要 用 到 的 文件 。 

O /media: 这 个 顶级 日 录用 于 包含 装载 可 移动 媒体 的 其 他 子 目 

录 。 其 目的 是 消除 不 必要 的 顶级 目录 ， 如 /cdrom 和 /floppy ° 

O mnt: 这 个 目录 只 是 用 来 方便 用 户 临 时 装载 一 些 其 他 的 文件 系 

统 。 以 前 ， 一 些 Linux 发 行 版 还 会 在 该 目录 中 针对 不 同 的 设备 添加 

一 些 子 日 录 ， 如 /mnt 目 录 下 的 cdrom 和 floppy 子 目录 ， 但 现在 用 于 

装载 这 些 设备 的 首选 位 置 是 在 /media 目 录 下 ，/mnt 目 录 将 作为 一 

个 顶级 的 临时 装载 位 置 。 

O /opt: 软件 三 两 在 癌 系 统 中 添加 软件 时 会 用 到 这 个 目录 。 按 照 

惯例 ，Linux 发 行 版 一 般 不 会 将 目 己 发 布 的 软件 放置 在 这 个 目录 

下 ， 而 是 将 这 个 目录 开放 给 第 三 方 厂商 来 使 用 。 厂 商 通常 会 在 这 

个 目录 下 以 它们 的 名 字 创 建 一 个 子 目 未 ， 然 后 针对 它们 的 应 用 程 

序 ， 在 这 个 子 目 孙 下 继续 创建 如 /bin 和 /lib 等 子 目 孙 。 

按照 惯例 ， 大 多 数 开放 源码 的 Linux 软 件 包 将 目录 /sr/local 作 为 它 

们 的 安装 点 。 

O /root: 这 个 日 录 下 放置 的 是 root 用 户 使 用 的 文件 。 它 并 没有 放 

Ahome HK FRKE, AHP RAT, home H xi IER 

O /sbin: 这 个 目录 下 放置 的 是 通常 只 能 由 系统 管理 员 使 用 的 命 

令 ， 以 及 在 系统 启动 时 或 进入 单 用 户 模 式 时 需要 使 用 的 命令 。 合 

令 fsck、halt 和 swapon 等 束 在 这 个 目录 中 。 

O /srv: 这 个 日 录用 于 放置 站 点 特定 的 只 读 配 置 数 据 ， 但 它 目 前 

还 未 被 普遍 使 用 。 

口 /tmp: 这 个 目录 下 放置 的 是 临时 文件 。 系 统 通 常会 在 (但 并 不 

总 是 ) 启动 时 清理 这 个 目录 。 

口 /us: 这 是 一 个 相当 复杂 的 二 级 文件 系统 ， 在 这 个 目录 下 ， 通 

常 将 包含 除 在 系统 启动 或 进入 单 用 户 模式 所 需要 的 文件 以 外 的 所 

有 系统 类 的 命令 和 函数 库 。 它 包含 许多 子 目 系 ， 

如 /bin、Vlib、/X11R6 和 /local。 

在 UNIX 和 Linux 发 展 的 早期 ，/musr 目 了 永 下 还 有 用 于 记录 日 志和 放置 
邮件 队列 等 的 子 目 录 ， 但 现在 它们 都 已 经 从 usr 目 隶 下 移出 并 放置 到 var 
目 好 中。 这 样 做 的 好 处 是 ，/usr 目 好 作为 一 个 可 装载 的 文件 系统 ， 可 以 


FE Bor E [8] BDA Sea JT CURE RSP ^. 24 usr E eA Rey ae 
载 时 ， 它 可 以 通过 网 络 与 其 他 系统 共 孚 ， 而 且 当 系统 由 于 一 些 不 可 控 
人 


O War: 这 个 目 孙 下 放置 的 数据 是 会 经 营 改 变 的 ， 如 用 于 打印 的 
队列 文件 、 应 用 程序 的 日 志文 件 和 邮件 队列 目 孙 等 。 


b 


18.4 不 


如 果 你 想 编写 和 分 发 一 个 具备 完全 可 移植 性 的 Linux 应 用 程序 ， 除 
了 上 面 所 介绍 的 内 容 外 ， 当 然 还 需要 考虑 许多 其 他 事情 。 

你 想 本 地 化 应 用 程序 ， 让 它 可 以 在 不 同 的 地 点 、 使 用 不 同 的 语言 
运行 吗 ? 即使 你 在 程序 中 坚持 使 用 英语 ， 你 仍然 需要 考虑 如 货币 、 数 
字 分 隔 符 和 日 期 格式 等 许多 其 他 问题 。 你 猜 对 了 ， 人 们 正在 对 这 些 事 
pre 标准 化 ， 你 可 以 访问 http://www.openil8n.org/ 来 查看 它们 的 标准 

情况 。 

编写 应 用 程序 时 ， 另 一 个 需要 考虑 的 问题 是 目标 系统 安装 了 哪个 
版 本 的 函数 库 ， 它 使 用 的 选项 是 什么 ， 等 等 。 邓 运 的 是 ， 由 于 我 们 在 
本 章 中 所 看 到 的 标准 化 工作 ， 这 个 问题 已 经 显得 不 那么 明显 ， 但 它 仍 
然 是 一 个 比较 困难 的 问题 。 有 一 组 GNU 工 具 可 以 极 大 地 帮助 我 们 解决 
这 一 问题 ， 它 们 是 autoconf 和 automake。 虽 然 你 可 能 不 会 直接 使 用 它 
们 ， 但 当 通 过 源 代 码 安 闭 软 件 ， 在 命令 行 键 入 命令 ./configure;make 
hr. (ILE RES Sal EAI © 

这 些 工 具 的 用 法 已 超出 了 本 书 介绍 的 范围 ， 但 你 可 以 通过 GNU 的 
网 站 http://www.gnu.org/software/autoconf 和 
http://www.gnu.org/software/automake 找 到 关于 它们 的 更 多 信息 。 


18.5 小结 


在 本 章 中 ， 我 们 简单 介绍 了 众多 UNIX 标 准 中 的 一 部 分 ， 它 们 帮助 
Linux 成 为 一 个 易于 编程 的 平台 ， 并 且 确 保 许 多 不 同 的 Linux 发 行 版 遵 
守 一 些 基本 的 标准 。 遵 守 标 准 可 以 让 编程 人 员 和 用 户 的 工作 变 得 更 加 
轻松 ， 所 以 我 们 要 求 和 或 励 读 者 使 用 标准 。 
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